需求描述:
1:非結(jié)構(gòu)化數(shù)據(jù)分析處理;
2:行業(yè)數(shù)據(jù)清洗標(biāo)注治理;
3:AI大模型高質(zhì)量數(shù)據(jù)集;
崗位職責(zé):
1、數(shù)據(jù)處理與分析能力:熟練掌握文本挖掘、圖像識(shí)別、音頻視頻分析等技術(shù),能夠從海量非結(jié)構(gòu)化數(shù)據(jù)中提取有價(jià)值信息,如在文本數(shù)據(jù)中精準(zhǔn)挖掘關(guān)鍵事件、人物關(guān)系等;對圖像數(shù)據(jù)進(jìn)行特征提取和分類。
2、數(shù)據(jù)管理與存儲(chǔ)技術(shù):熟悉分布式文件系統(tǒng)(如 HDFS)、對象存儲(chǔ)(如 MinIO)等,能高效管理和存儲(chǔ)非結(jié)構(gòu)化數(shù)據(jù),確保數(shù)據(jù)的安全性、可靠性和可擴(kuò)展性,實(shí)現(xiàn)數(shù)據(jù)的快速讀寫與備份恢復(fù)。
3、數(shù)據(jù)治理流程與策略制定:具備制定非結(jié)構(gòu)化數(shù)據(jù)治理流程和策略的能力,涵蓋數(shù)據(jù)標(biāo)準(zhǔn)制定、數(shù)據(jù)質(zhì)量評(píng)估、數(shù)據(jù)生命周期管理等,能根據(jù)企業(yè)需求建立合理的數(shù)據(jù)治理框架,同時(shí)形成高質(zhì)量數(shù)據(jù)集。
4、溝通協(xié)作與項(xiàng)目管理能力:能夠與不同部門進(jìn)行有效溝通,了解業(yè)務(wù)需求,協(xié)同推進(jìn)數(shù)據(jù)治理項(xiàng)目;具備項(xiàng)目管理能力,合理安排資源、制定計(jì)劃、把控項(xiàng)目進(jìn)度,確保項(xiàng)目按時(shí)高質(zhì)量完成。
任職要求:
1.學(xué)歷要求:本科及以上學(xué)歷,雙一流院校畢業(yè)優(yōu)選;
2.計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)科學(xué)等相關(guān)專業(yè);
3.35歲以下,3年以上大數(shù)據(jù)開發(fā)相關(guān)工作經(jīng)驗(yàn),掌握非結(jié)構(gòu)化數(shù)據(jù)治理能力,掌握不同數(shù)據(jù)治理工具和產(chǎn)品使用。
5、專業(yè)技能:
(1)元數(shù)據(jù)管理能力:精通非結(jié)構(gòu)化數(shù)據(jù)元數(shù)據(jù)的提取、分類和管理,能夠建立全面且準(zhǔn)確的元數(shù)據(jù)目錄,清晰定義數(shù)據(jù)的來源、格式、內(nèi)容描述等信息,從而實(shí)現(xiàn)對數(shù)據(jù)資產(chǎn)的有效編目和檢索,提升數(shù)據(jù)查找與利用效率。
(2)數(shù)據(jù)安全保障技能:熟悉數(shù)據(jù)加密、訪問控制、數(shù)據(jù)脫敏等安全技術(shù)在非結(jié)構(gòu)化數(shù)據(jù)場景中的應(yīng)用。能夠制定并執(zhí)行完善的數(shù)據(jù)安全策略,確保數(shù)據(jù)在存儲(chǔ)、傳輸和使用過程中的保密性、完整性和可用性,防止數(shù)據(jù)泄露與非法訪問。
(3)人工智能與機(jī)器學(xué)習(xí)知識(shí)應(yīng)用:掌握機(jī)器學(xué)習(xí)算法和人工智能技術(shù),如自然語言處理(NLP)、深度學(xué)習(xí)等,用于非結(jié)構(gòu)化數(shù)據(jù)的自動(dòng)分類、聚類和預(yù)測分析,借助智能技術(shù)提升數(shù)據(jù)治理的自動(dòng)化水平和分析準(zhǔn)確性。
(4)數(shù)據(jù)治理工具操作技能:熟練使用主流的非結(jié)構(gòu)化數(shù)據(jù)治理工具,如 Alfresco、OpenText 等,能夠運(yùn)用這些工具完成數(shù)據(jù)采集、清洗、轉(zhuǎn)換、存儲(chǔ)等一系列治理任務(wù),同時(shí)具備根據(jù)業(yè)務(wù)需求對工具進(jìn)行定制化配置的能力 。
(5)熟練掌握 Python、R、Java、Scala 等編程語言中的至少一種,精通 Python 語言者在數(shù)據(jù)科學(xué)領(lǐng)域更具優(yōu)勢;熟悉 Hadoop、Spark、Flink、Hive 等大數(shù)據(jù)處理框架和工具,能夠搭建和優(yōu)化大數(shù)據(jù)平臺(tái),進(jìn)行大規(guī)模數(shù)據(jù)的存儲(chǔ)、管理和處理;熟悉常用的數(shù)據(jù)挖掘算法,如分類、聚類、關(guān)聯(lián)規(guī)則挖掘等;熟練使用 Tableau、PowerBI、Superset 等數(shù)據(jù)可視化工具,能夠?qū)?fù)雜的數(shù)據(jù)結(jié)果以直觀易懂的圖表形式展示給業(yè)務(wù)人員和管理層
6、其他:有良好的邏輯思維能力、表達(dá)與分析能力、團(tuán)隊(duì)合作精神和主動(dòng)溝通意識(shí),具有良好的團(tuán)隊(duì)協(xié)作精神和強(qiáng)烈的團(tuán)隊(duì)責(zé)任心;
福利待遇
1.薪資面議
2.雙休,入職繳納五險(xiǎn)一金,每年一次體檢,帶薪年假,節(jié)假日正常休息。