更新于 2月27日

爬蟲開發(fā)工程師

1.5-2萬
  • 北京東城區(qū)
  • 燈市口
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

數(shù)據(jù)挖掘數(shù)據(jù)清洗
1、對指定的多個網(wǎng)站進行網(wǎng)頁分析、數(shù)據(jù)爬取和提取、破解反爬策略;
2、負責數(shù)據(jù)清洗、入庫、服務(wù)化等研發(fā)和優(yōu)化工作;
3、分析目標站網(wǎng)頁結(jié)構(gòu),并選取最優(yōu)爬取方式,監(jiān)控目標數(shù)據(jù)變化,定時更新,保證數(shù)據(jù)時效性;
4、參與開發(fā)和設(shè)計分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進行信息的抓取和分析工作;
5、研究爬蟲策略和防屏蔽規(guī)則,解決身份、驗證碼、IP限制、頁面跳轉(zhuǎn)、動態(tài)標簽等難點,提升網(wǎng)頁抓取的效率和質(zhì)量;
6、溝通和理解相關(guān)部門的爬取需求,并給出專業(yè)的建議和解決方案;

職位要求:
本科及以上學歷,計算機相關(guān)專業(yè),具備3年以上爬蟲開發(fā)相關(guān)經(jīng)驗;
精通Python語言、開源爬蟲框架、數(shù)據(jù)抽取技術(shù);熟悉HTTP/HTTPS協(xié)議、爬蟲相關(guān)前端技術(shù);
熟悉常見的反爬蟲機制,并能使用相應(yīng)的技術(shù)手段進行應(yīng)對,如IP 代理、用戶代理、驗證碼識別等;
熟悉數(shù)據(jù)庫技術(shù),如 MySQL、MongoDB等,能夠進行數(shù)據(jù)的存儲和查詢;
具備優(yōu)秀的邏輯思維能力,對解決挑戰(zhàn)性問題充滿熱情,善于分析問題/解決問題;
有爬蟲結(jié)合AI經(jīng)驗優(yōu)先。

工作地點

北京市東城區(qū)東華門燈市口大街33號(燈市口地鐵站A西北口步行460米)

職位發(fā)布者

張女士/人事經(jīng)理

當前在線
立即溝通
公司Logo北京小希教育科技有限公司
小希教育是一家專注國際教育的互聯(lián)網(wǎng)企業(yè),致力于把互聯(lián)網(wǎng)技術(shù)應(yīng)用于傳統(tǒng)國際教育機構(gòu),以科技創(chuàng)新為驅(qū)動,共享優(yōu)質(zhì)國際教育資源,優(yōu)化服務(wù)流程,提升服務(wù)品質(zhì),讓更多留學生享受人性化、高品質(zhì)的服務(wù)。旗下獨立研發(fā)的國內(nèi)智能留學生態(tài)系統(tǒng)-一小希留學平臺,以第三方身份鏈接學生、海外院校和國內(nèi)外留學服務(wù)機構(gòu),始終秉承“實時對話海外院?!钡睦砟?,打破學生與學校間消息不對稱的壁壘。通過AI大數(shù)據(jù)和30余年國際教育服務(wù)經(jīng)驗積累,實現(xiàn)學生和學校間的智能匹配,更準確、更高效地完成學校申請。并建立安全防護系統(tǒng),層層把關(guān)、全程透明,保護用戶隱私和權(quán)益,讓用戶在平臺上的每筆留學服務(wù)交易都能安全放心。小希留學平臺矢志國際教育,堅持初心,攜手院校和顧問,共同為中國留學生提供優(yōu)質(zhì)的留學服務(wù),幫助他們實現(xiàn)留學夢想,助力中國國際化人才的培養(yǎng)。
公司主頁