更新于 3月26日

爬蟲工程師

5000-8000元
  • 鄭州金水區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

Python反爬蟲爬蟲開發(fā)數(shù)據(jù)清洗數(shù)據(jù)挖掘數(shù)據(jù)采集
職位內(nèi)容:
1.負(fù)責(zé)業(yè)務(wù)所涉及(社交媒體APP及WEB等)數(shù)據(jù)的爬取,清洗,結(jié)構(gòu)化,入庫,并持續(xù)運(yùn)營(yíng)維護(hù)。 2.設(shè)計(jì)、開發(fā)、維護(hù)、重構(gòu)單獨(dú)及分布式網(wǎng)絡(luò)爬蟲; 3.對(duì)采集到的數(shù)據(jù)進(jìn)行清洗和管理。 4.能夠獨(dú)立部署爬蟲程序,維護(hù)爬蟲服務(wù)器; 5.負(fù)責(zé)爬蟲的性能優(yōu)化和穩(wěn)定性優(yōu)化; 6.對(duì)常見的反爬、屏蔽、風(fēng)控規(guī)則對(duì)抗研究。 7.模擬觸控,實(shí)現(xiàn)對(duì)某個(gè)app的自動(dòng)化控制 8.編寫開發(fā)文檔,可供其他開發(fā)同事進(jìn)行后續(xù)開發(fā)支持;
任職要求:
1.熟練掌握C#、python、java、golang其中至少一門語言 精通動(dòng)態(tài)網(wǎng)頁抓取、瀏覽器模擬抓取、APP抓取等技術(shù)
2熟悉使用各類抓包工具 精通頁面信息抽取的方法,如:正則表達(dá)式、CSS選擇器、XPATH
3. 熟悉javascript,對(duì)常見的javascript混淆加密對(duì)抗有一定經(jīng)驗(yàn),熟悉常見的瀏覽器指紋追蹤和對(duì)抗方法 熟悉常見數(shù)據(jù)庫的操作、基本的數(shù)據(jù)結(jié)構(gòu)、使用和優(yōu)化
4.熟悉Linux操作系統(tǒng)的基本操作和維護(hù) 了解常見的網(wǎng)絡(luò)協(xié)議格式,如protobuf、https等協(xié)議 有開發(fā)爬蟲框架經(jīng)驗(yàn)
5.熟悉反爬蟲、驗(yàn)證碼識(shí)別技術(shù) 具備良好的溝通能力和團(tuán)隊(duì)協(xié)作能力
備注:
有小紅書APP、抖音APP、快手APP、微信、微博、********、知乎采集經(jīng)驗(yàn)的優(yōu)先 有移動(dòng)端app數(shù)據(jù)采集經(jīng)驗(yàn),掌握xposed、frida等工具框架優(yōu)先 有selenium、puppeteer、appium等自動(dòng)化測(cè)試工具使用經(jīng)驗(yàn),能夠快速編寫uiautomation等RPA腳本優(yōu)先
6.985 211優(yōu)先 計(jì)算機(jī)專業(yè)

工作地點(diǎn)

永和國(guó)際廣場(chǎng)-B區(qū)B607

職位發(fā)布者

王桐/人事主管

剛剛活躍
立即溝通
公司Logo諾賽聯(lián)合(河南)生物醫(yī)學(xué)科技有限公司
河南分中心建設(shè):國(guó)家人類基因組北方研究中心(CHGB)河南中心是國(guó)家中心會(huì)重點(diǎn)研究成果在河南地區(qū)轉(zhuǎn)化和落地的分支機(jī)構(gòu)。在河南省委、省政府的政策支持下,作為招才引智標(biāo)志性項(xiàng)目已成功簽約落地中原科技城,并與河南省醫(yī)學(xué)科學(xué)院合作成立生物科研聯(lián)合實(shí)驗(yàn)室,依托國(guó)家人類基因組北方研究中心專家團(tuán)隊(duì)和專利技術(shù)成果整合行業(yè)優(yōu)質(zhì)資源,旨在打造再生醫(yī)學(xué)行業(yè)高地和形成研、學(xué)、產(chǎn)一體化的業(yè)態(tài)模式。作為行業(yè)的標(biāo)桿機(jī)構(gòu),河南中心不僅著眼于科研成果的高效轉(zhuǎn)化,更促進(jìn)國(guó)家科研力量與河南經(jīng)濟(jì)發(fā)展的緊密結(jié)合,為河南乃至中原人民的生命健康服務(wù)保駕護(hù)航,為新時(shí)代生命科學(xué)的發(fā)展做出嶄新貢獻(xiàn)。
公司主頁