更新于 7月8日

Python爬蟲工程師

1-1.6萬
  • 北京西城區(qū)
  • 1-3年
  • 本科
  • 全職
  • 招1人

職位描述

1、負責分布式網絡爬蟲系統(tǒng)平臺的架構設計與開發(fā)(如抓取調度,多樣化抓取,頁面解析和結構化抽取,海量數據存儲和讀取等)、技術選型;
2、研究爬蟲策略和防屏蔽規(guī)則,解決封賬號、封IP、驗證碼、頁面跳轉等難點攻克,提升網頁抓取的效率和質量;
3、利用主流的大數據相關技術,對抓取后的網頁數據進行清洗、存儲等;并持續(xù)優(yōu)化平臺,以便滿足各種爬取業(yè)務需求;
4、把握網絡爬蟲核心技術研究方向,研究優(yōu)化算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性;
職位要求:
1、熟悉scrapy框架,分布式系統(tǒng),python爬蟲。
2、熟悉http協議,kafka,linux基本命令,金融基礎知識。
3、熟悉javascript .熟悉css.xpath.正則提取,mysql增刪改差,sql優(yōu)化,js逆向,redis,mongodb。
4、精通爬蟲和反爬技術,精通http底層協議;精通深度抓取、動態(tài)網頁技術抓取、瀏覽器模擬抓取、APP抓取等技術;
5、有很強的學習能力和技術鉆研能力,積極主動,思維靈活開放,有良好的溝通能力,善于跨團隊合作。

職位福利:定期體檢、員工旅游、節(jié)日福利、帶薪年假、五險一金、彈性工作、定期團建

工作地點

車公莊大街乙5號鴻儒大廈

職位發(fā)布者

海峰科技/招聘專員

三日內活躍
立即溝通
公司Logo海峰科技
北京海峰科技有限責任公司,注冊成立于2014年底,是國內獨立的第三方私募基金外包業(yè)務服務機構,主要發(fā)起人來自高盛、瑞銀、Bridgewater Associates和工行等專業(yè)金融機構有平均15年以上的經驗,獲得美國風險投資公司IDG投資,是中國證券基金業(yè)協會公示的第二批私募基金外包服務機構公司發(fā)展:成立于2014年,同年獲得美國風險投資控制公司IDG的投資,并于2015年6月8日正式完成中國基金協會登記備案,2019年7月3日正式拿到份額登記業(yè)務牌照。業(yè)務覆蓋基金外包服務的基金估值核算及風險控制等。2017年獲得國家高新技術企業(yè)證書和中關村高新技術企業(yè)證書。行業(yè)地位:國內獨立第三方私募基金外包服務機構。公司現狀:總部北京,滬深分部,員工80+人,500+付費客戶。我們在整個私募合規(guī)生命周期中,提供一站式合規(guī)服務。合規(guī)專業(yè)的人做專業(yè)合規(guī)的事,最終成為私募合規(guī)領域的風向標。
公司主頁