職位描述
1、負(fù)責(zé)爬蟲需求分析,分布式網(wǎng)絡(luò)爬蟲系統(tǒng)的開發(fā)和優(yōu)化
2、負(fù)責(zé)實(shí)時(shí)監(jiān)控爬蟲的運(yùn)行狀態(tài)和預(yù)警處理
3、負(fù)責(zé)海量數(shù)據(jù)的爬取、清洗、解析、入庫
4、負(fù)責(zé)持續(xù)維護(hù)爬蟲系統(tǒng)的正常運(yùn)行
職位要求
1、對于常見網(wǎng)站的反爬技術(shù)如js加密混淆等有分析應(yīng)用;
2、5年以上爬蟲經(jīng)驗(yàn),精通python語言,熟悉正則表達(dá)式,熟悉html;
3、熟悉分布式系統(tǒng);
4、熟悉Linux平臺開發(fā),并且熟悉多線程多進(jìn)程編程、網(wǎng)絡(luò)編程,熟悉HTTP、TCP/UDP協(xié)議;
5、熟悉mysql,redis,mongo等數(shù)據(jù)庫的使用。
6、熟悉以下消息隊(duì)列的一種、如kafka、pulsar、rocketmq
加分項(xiàng)
1、熟悉APP攻防逆向,包括但不限于:逆向分析、虛擬多開等
2、對scrapy,pyppeteer,appinum或者其他爬蟲框架有研究了解;
3、對大規(guī)模存儲了解
4、熟悉golang