更新于 2月11日

高級數據工程師

2.5-3.5萬
  • 大連甘井子區(qū)
  • 經驗不限
  • 本科
  • 全職
  • 招1人

職位描述

數據倉庫Sql

一、工作職責
1. 為Scilit數據庫進行數據倉庫的設計、開發(fā)、維護工作,推動數據工程技術棧革新,整合MDPI公司級數倉體系,構建豐富穩(wěn)定的數據資產,推動Scilit的數據產品化;
2. 協(xié)同相關方,將產品/數據分析/算法需求轉化為數據工程需求,構建數據Pipeline和ETL任務,增進相關合作方的數據使用便利;
3. 建立和提高數據模型的準確性、易用性、靈活性、可擴展性,提升查詢效率,為可視化報表開發(fā)、數據分析、工程項目和算法開發(fā)等下游數據應用提供良好的數據條件;
4. 承擔大規(guī)模復雜指標的快速計算和維護任務,根據業(yè)務和數據分析需求,開發(fā)、倉儲和維護分析表(寬表),優(yōu)化其查詢效率;
5. 收集、清洗、整理Scilit數據,提升Scilit數據質量、數據可用性和數據效率,使得數據準確、一致、完整、有效、及時。搭建數據質量校驗、報警、自動整理機制;
6. 建立數據字典,將常用維度和指標的技術口徑文檔化。


二、職位要求
1. 熟練運用書面和口語英語交流數倉技術,可以勝任同國際化團隊協(xié)同工作;
2. 計算機、信息技術、信息管理、數據管理、數據科學等相關專業(yè)本科及以上學歷;
3. 熟練使用數據工程工具,例如:
? SQL類工具,如MySQl和PostgreSQL等
? Python數據類工具:如pandas, polars, DuckDB, PyArrow, Great Expectation等
? Data Lake相關工具:Delta Like, Parquet, Amazon S3, Apache Iceberg等
? Airflow等數據調度工具
4. 具備較好的維度建模方法論,獨立負責過數倉架構設計和優(yōu)化,熟練ETL、數倉分層、性能調優(yōu),了解MySQL數據庫模型和數據結構;
5. 熟悉一門或多門面向對象的編程語言:Python/Java/Scala/C++;
6. 熟悉從數據生產到數據消費的全鏈路,具有將技術和優(yōu)秀的業(yè)務理解相結合的能力,發(fā)掘機會、解決問題;
7. 兩年以上對口行業(yè)經驗,優(yōu)秀者工作年限可適當放寬;
8. 邏輯清晰嚴謹,對數據敏感,跨團隊協(xié)作能力、溝通能力強。
加分項:
? 熟悉以下技術:
* PHP Symfony
* 元數據管理,如DataHub
* 圖數據庫和圖數據分析
* 其它:Apache Solr, Shell, Git
* Streamlit
* Docker
? 有學術出版、文獻計量學和科學計量學、作者消歧等相關知識、技能和經驗;
? 了解數據分析/機器學習/NLP,或有將數據分析/算法和業(yè)務洞察能力結合的經驗。


三、工資待遇
1. 薪資待遇:25000-35000;
2. 基礎福利:六險一金,帶薪年假,年度體檢,節(jié)日福利,活動經費,豐富茶歇,營養(yǎng)晚餐等;
3. 進階福利:子女福利,父母福利,團隊獎勵,培訓津貼,崗位津貼;
4. 職業(yè)發(fā)展:導師培養(yǎng),技能培訓,管理培訓。


四、辦公地點
遼寧省大連高新技術產業(yè)園區(qū)黃浦路浦項IT中心A塔13層

工作地點

曼迪匹艾(大連)科技服務有限公司遼寧省大連高新技術產業(yè)園區(qū)黃浦路浦項IT中心A塔13層

職位發(fā)布者

王女士/HR

立即溝通
公司Logo曼迪匹艾(大連)科技服務有限公司
曼迪匹艾科技服務有限公司 MDPI(Multidisciplinary Digital Publishing Institute)由林樹坤博士創(chuàng)辦于1996年,是全球領先的Open Access出版公司之一,總部位于瑞士巴塞爾,同時在中國,西班牙,塞爾維亞,英國,日本,羅馬尼亞,加拿大,波蘭以及新加坡設有分公司。 MDPI中國區(qū)在北京,武漢,天津,南京,大連共設有七個代表處,主要負責MDPI期刊的編輯出版工作。 MDPI致力于開放獲取出版服務,目前出版英文科技期刊380余種,其中SCIE期刊90余種。期刊領域覆蓋生物、化學、醫(yī)藥、機械、能源、環(huán)境、農林等各學科,其中包含眾多國際知名期刊如Molecules, Sensors, IJMS, Marine Drugs, Energies等。
公司主頁