崗位職責:
1.負責設(shè)計并實施分布式數(shù)據(jù)平臺架構(gòu),優(yōu)化數(shù)據(jù)存儲、處理和分析流程。參與大數(shù)據(jù)平臺產(chǎn)品的規(guī)劃、設(shè)計、開發(fā)和迭代,提升平臺的穩(wěn)定性、可擴展性和易用性。
2.基于Hadoop、Spark、Flink等大數(shù)據(jù)處理框架,設(shè)計并實現(xiàn)高效的海量數(shù)據(jù)模型,確保數(shù)據(jù)的高效存儲與訪問。負責數(shù)據(jù)開發(fā)流程,包括數(shù)據(jù)清洗、轉(zhuǎn)換、加載及數(shù)據(jù)治理工作,以滿足業(yè)務(wù)對數(shù)據(jù)的高并發(fā)訪問需求。
3.利用開源框架進行大數(shù)據(jù)的采集工作,確保數(shù)據(jù)的完整性、準確性和及時性。進行深度數(shù)據(jù)分析,挖掘數(shù)據(jù)價值,為業(yè)務(wù)決策提供數(shù)據(jù)支持。整理分析結(jié)果,形成清晰、易于理解的報告或可視化展示。
4.針對大數(shù)據(jù)處理過程中的性能瓶頸,進行調(diào)優(yōu)和故障排查。利用Hadoop、Spark、Flink等技術(shù)的特性,優(yōu)化資源配置和作業(yè)調(diào)度,提高數(shù)據(jù)處理效率。
5.關(guān)注大數(shù)據(jù)領(lǐng)域的新技術(shù)、新趨勢,探索其在業(yè)務(wù)中的應(yīng)用可能性,推動技術(shù)升級和創(chuàng)新。
任職要求:
1.擁有5年或以上大數(shù)據(jù)開發(fā)經(jīng)驗,其中至少3年專注于大數(shù)據(jù)架構(gòu)設(shè)計與實現(xiàn)。具備扎實的大數(shù)據(jù)理論基礎(chǔ)和實踐經(jīng)驗,能夠獨立完成復(fù)雜的大數(shù)據(jù)項目。
2.具備豐富的大數(shù)據(jù)架構(gòu)設(shè)計經(jīng)驗,能夠根據(jù)業(yè)務(wù)需求設(shè)計高可用、可擴展的大數(shù)據(jù)平臺架構(gòu)。熟悉分布式系統(tǒng)原理,能夠設(shè)計并實施分布式數(shù)據(jù)存儲和處理方案。能夠評估新技術(shù)在大數(shù)據(jù)平臺上的應(yīng)用潛力,并進行技術(shù)選型與集成。
3.熟練掌握Hadoop、Spark、Flink等大數(shù)據(jù)核心技術(shù),能夠針對不同量級的數(shù)據(jù)量進行配置調(diào)優(yōu)和組件維護。熟悉Hbase、Hdfs、MapReduce、Yarn、Zookeeper、Hive、Kafka等大數(shù)據(jù)生態(tài)系統(tǒng)中的關(guān)鍵組件,能夠閱讀并理解源碼,解決復(fù)雜問題。了解并能應(yīng)用NoSQL數(shù)據(jù)庫(如MongoDB、Cassandra等)以及實時數(shù)據(jù)流處理技術(shù)(如Storm、Samza等)。
4.具備豐富的海量數(shù)據(jù)性能處理經(jīng)驗,能夠基于Hive和MySQL進行SQL優(yōu)化,提升查詢效率。熟悉數(shù)據(jù)分區(qū)、索引、緩存等策略,能夠設(shè)計并實施有效的數(shù)據(jù)預(yù)處理和存儲方案,降低數(shù)據(jù)處理成本。能夠快速定位并解決大數(shù)據(jù)處理過程中的性能瓶頸和故障問題。
5.熟悉數(shù)據(jù)倉庫建模方法,能夠設(shè)計合理的數(shù)據(jù)模型以滿足業(yè)務(wù)需求。具備數(shù)據(jù)質(zhì)量與數(shù)據(jù)治理經(jīng)驗,了解數(shù)據(jù)生命周期管理、數(shù)據(jù)安全管理等相關(guān)知識。能夠制定并執(zhí)行數(shù)據(jù)治理策略,確保數(shù)據(jù)的準確性、完整性和一致性。
6.熟練使用Java核心框架,如Spring Cloud、Spring Boot等,能夠編寫高效、可維護的代碼。了解Python、Scala等大數(shù)據(jù)相關(guān)編程語言,能夠根據(jù)需要選擇最合適的編程語言進行開發(fā)。
7.具備良好的溝通表達能力和跨團隊協(xié)作能力,能夠與團隊成員、業(yè)務(wù)方有效溝通,協(xié)同推進項目進展。
8.對新技術(shù)保持好奇心,愿意不斷學習新知識,探索新技術(shù)在大數(shù)據(jù)領(lǐng)域的應(yīng)用。具備創(chuàng)新思維,能夠提出并推動技術(shù)改進和優(yōu)化方案,持續(xù)提升大數(shù)據(jù)平臺的性能和穩(wěn)定性。