崗位職責(zé):
1.負(fù)責(zé)大語言模型(如Deepseek、Qwen、GLM等)的微調(diào)、訓(xùn)練及性能優(yōu)化,提升模型在特定場(chǎng)景下的表現(xiàn)。
2.構(gòu)建行業(yè)垂直領(lǐng)域的專用模型與知識(shí)庫系統(tǒng),推動(dòng)業(yè)務(wù)場(chǎng)景的智能化解決方案落地。
3.協(xié)同研發(fā)團(tuán)隊(duì)完成智能應(yīng)用產(chǎn)品的設(shè)計(jì)、開發(fā)與部署,包括但不限于對(duì)話系統(tǒng)、知識(shí)推理等方向。
4.跟蹤前沿技術(shù)進(jìn)展,探索大語言模型與行業(yè)需求結(jié)合的技術(shù)創(chuàng)新點(diǎn)。
任職要求:
1.本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)或相關(guān)專業(yè),2年以上人工智能開發(fā)經(jīng)驗(yàn)者優(yōu)先。
2.熟練掌握PyTorch/TensorFlow等深度學(xué)習(xí)框架,熟悉Transformer架構(gòu)及NLP領(lǐng)域核心技術(shù)(如預(yù)訓(xùn)練、微調(diào)、Prompt工程)。
3.具備大語言模型實(shí)戰(zhàn)經(jīng)驗(yàn),包括分布式訓(xùn)練、模型壓縮、推理加速等技術(shù),熟悉LangChain、Hugging Face等工具鏈。
4.扎實(shí)的編程能力,精通Python,熟悉Linux開發(fā)環(huán)境及CUDA加速,有工程落地經(jīng)驗(yàn)者優(yōu)先。
5.邏輯清晰,具備跨團(tuán)隊(duì)協(xié)作能力,對(duì)AI技術(shù)商業(yè)化有強(qiáng)烈興趣。
6.加分項(xiàng):擁有Deepseek、Qwen、LAMM、GLM等模型的實(shí)際項(xiàng)目經(jīng)驗(yàn)或開源貢獻(xiàn)。