工作職責:
1.使用爬蟲技術采集指定的互聯網數據;
2.對采集的數據進行清洗治理;
3 負責爬蟲系統外部調用接口的實現。
任職要求:
1.本科以上學歷,計算機相關專業 ,3年以上爬蟲工作經驗,獨立設計開發爬蟲系統;
2 精通Python語言,熟練掌握主流爬蟲框架;熟悉常用的庫requests/gevent等;
3.了解各種加密算法,能夠獨立解決js反爬和模擬登陸問題等問題;
4.熟練掌握正則表達式、XPath、CSS等網頁信息抽取技術;
5. 熟悉常見反爬機制,驗證碼識別,IP代理池、應用Ip池、headers認證和cookie等;
6. 熟練使用Selenium等爬蟲框架實施動態抓取;
7.熟悉熟練使用charles、fiddler等抓包工具者優先。