職位描述:
1、模型架構(gòu)設(shè)計(jì):理解業(yè)務(wù)場景,參考前沿技術(shù),設(shè)計(jì)適配的大模型架構(gòu),對開源模型按需評估、優(yōu)化,開發(fā)符合場景需求模型。
2、模型開發(fā):運(yùn)用主流深度學(xué)習(xí)框架(如 TensorFlow、PyTorch 等),承擔(dān)大模型核心編碼,搭建神經(jīng)網(wǎng)絡(luò),開發(fā)從數(shù)據(jù)處理到分布式訓(xùn)練流程,保障模型穩(wěn)定訓(xùn)練。
3、場景優(yōu)化:協(xié)同業(yè)務(wù)團(tuán)隊(duì),依據(jù)數(shù)據(jù)特性優(yōu)化模型,運(yùn)用量化、剪枝等手段,平衡精度與成本,適配不同部署環(huán)境。
4、項(xiàng)目推進(jìn):作為技術(shù)主力,規(guī)劃項(xiàng)目,協(xié)調(diào)算法、數(shù)據(jù)、工程團(tuán)隊(duì),對接上下游,推動模型落地應(yīng)用。
5、技術(shù)探索:關(guān)注前沿動態(tài),調(diào)研新技術(shù),參與開源交流,為團(tuán)隊(duì)引入創(chuàng)新點(diǎn)。
任職要求:
1、教育背景:本科及以上學(xué)歷,計(jì)算機(jī)、人工智能等相關(guān)專業(yè)。
2、專業(yè)技能 :熟練掌握至少一種深度學(xué)習(xí)框架,有 1 - 2 年神經(jīng)網(wǎng)絡(luò)開發(fā)經(jīng)驗(yàn),了解常見模型架構(gòu)優(yōu)化方法,能搭建、訓(xùn)練模型。熟悉大規(guī)模數(shù)據(jù)處理基礎(chǔ),了解分布式訓(xùn)練,掌握 Python 等編程語言,能利用 GPU 資源訓(xùn)練模型。
3、問題解決能力:能分析解決模型訓(xùn)練中的常見問題,如收斂困難、過擬合,有模型優(yōu)化相關(guān)經(jīng)驗(yàn),能應(yīng)對業(yè)務(wù)場景挑戰(zhàn)。
4、團(tuán)隊(duì)協(xié)作:具備團(tuán)隊(duì)協(xié)作精神,能與多團(tuán)隊(duì)溝通協(xié)作,理解業(yè)務(wù)需求,助力項(xiàng)目落地。
5、學(xué)習(xí)能力:熱愛學(xué)習(xí)新技術(shù),能緊跟大模型發(fā)展趨勢,探索應(yīng)用于實(shí)際項(xiàng)目。
加分項(xiàng):
1、發(fā)表過大模型相關(guān)論文或技術(shù)文章者優(yōu)先。
2、參與過開源項(xiàng)目者優(yōu)先。
3、有跨模態(tài)模型開發(fā)經(jīng)驗(yàn)優(yōu)先。
4、了解特定行業(yè)知識并參與過相關(guān)項(xiàng)目優(yōu)先。