1. 負責搭建和維護先進的大數(shù)據(jù)平臺,集成和配置大數(shù)據(jù)生態(tài)系統(tǒng)中的組件,例如Apache Hadoop、Spark、Flink、Kafka、Zookeeper等,確保平臺的穩(wěn)定性、高效性和安全性;
2. 負責大數(shù)據(jù)數(shù)據(jù)業(yè)務(wù)模型研發(fā)與創(chuàng)新,深入研究并應(yīng)用大數(shù)據(jù)處理、存儲和分析技術(shù),構(gòu)建大規(guī)模結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)業(yè)務(wù)模型,并不斷優(yōu)化存儲方案以提升數(shù)據(jù)處理性能;
3. 負責數(shù)據(jù)庫架構(gòu)設(shè)計,利用關(guān)系型、NewSQL、和多模型數(shù)據(jù)庫等技術(shù),進行數(shù)據(jù)庫架構(gòu)的現(xiàn)代化設(shè)計,優(yōu)化性能,解決數(shù)據(jù)庫中心建設(shè)設(shè)計問題和分布式數(shù)據(jù)庫的擴展性和一致性問題。
4. 主導數(shù)據(jù)倉庫的建設(shè)工作,采用MPP架構(gòu)等多種存儲技術(shù),設(shè)計高效的數(shù)據(jù)倉庫架構(gòu)包括數(shù)據(jù)模型設(shè)計、數(shù)據(jù)集市規(guī)劃等,以滿足不同業(yè)務(wù)場景的數(shù)據(jù)應(yīng)用和分析需求;
5. 負責開發(fā)并優(yōu)化ETL、數(shù)據(jù)處理過程,設(shè)計并實現(xiàn)分布式計算任務(wù),搭建高效的數(shù)據(jù)處理分析流程,確保數(shù)據(jù)處理和分析的準確性和時效性;
6. 負責數(shù)據(jù)中臺體系建設(shè)、優(yōu)化數(shù)據(jù)模型、分層等數(shù)據(jù)產(chǎn)品,確保數(shù)據(jù)質(zhì)量,對數(shù)據(jù)模型等數(shù)據(jù)項目進行策略分析,提出改進建議,推動數(shù)據(jù)治理和數(shù)據(jù)價值的最大化;
7. 關(guān)注大數(shù)據(jù)技術(shù)及人工智能的最新發(fā)展,持續(xù)學習并引入新技術(shù),提升團隊的技術(shù)水平和創(chuàng)新能力。
任職要求:
1. 本科及以上學歷,計算機相關(guān)專業(yè),3年以上經(jīng)驗;
2. 掌握hadoop和hive以及Hadoop生態(tài)系統(tǒng)及MR/Spark計算框架,能熟練使用spark、Hadoop、hive、flink
3. 掌握數(shù)大數(shù)據(jù)管理工具的使用并進行數(shù)據(jù)處理操作及數(shù)據(jù)存儲;
4. 掌握Hue、Jupyter、Shell工具的使用,能夠編寫復雜的shell腳本;
5. 掌握SQL/HQL基本語法,能夠編寫SQL進行數(shù)據(jù)源整理、數(shù)據(jù)清洗等;
6. 掌握python/Java/Scala/R任意一種數(shù)據(jù)分析編程語言;
7. 掌握Sqoop、DataX等命令行操作以及常用數(shù)據(jù)庫和文件系統(tǒng)間數(shù)據(jù)傳輸配置以及HDFS分布式文件系統(tǒng);
8. 工作積極主動,有良好的團隊合作精神,能夠承受較強的工作壓力,接受不定期出差及駐場開發(fā);
9. 具有機器學習算法方面工作經(jīng)驗者優(yōu)先。
蘭州 - 七里河區(qū)
蘭州 - 七里河區(qū)
蘭州 - 城關(guān)區(qū)
中電信醫(yī)療健康科技有限公司蘭州 - 城關(guān)區(qū)
蘭州 - 七里河區(qū)
蘭州 - 七里河區(qū)