一、崗位職責
1.負責軌道交通場景語義大模型建設與應用;
2.負責大模型訓練、推理、部署環(huán)境的開發(fā)和維護;
3.負責推進分布式訓練中的并行計算、通信優(yōu)化、穩(wěn)定性提升等工作;
4.負責利用多 GPU、多節(jié)點進行模型訓練,提高訓練效率,來提高模型的泛化能力;
5.組織與相關業(yè)務進行需求對接,撰寫技術報告、模型、算法文檔等。
二、任職要求
1.計算機科學或人工智能相關專業(yè),碩士(5年以上工作經(jīng)驗)、博士;
2.熟悉模型部署流程,能夠在不同的生產(chǎn)環(huán)境中部署模型,如云平臺、邊緣設備等,實施模型監(jiān)控策略,跟蹤模型性能,確保模型在生產(chǎn)環(huán)境中的穩(wěn)定性和可靠性;
3.具有獨立開發(fā)能力以及合作開發(fā)能力,具有較強的團隊精神、良好的溝通協(xié)調(diào)能力、較強的分析和解決問題的能力。
三、專業(yè)技能
1.優(yōu)秀的代碼能力、數(shù)據(jù)結(jié)構和基礎算法功底,熟練掌握Python,熟悉Linux開發(fā)環(huán)境;
2.掌握SFT、RLHF、prompt等技術,具備大模型訓練、調(diào)優(yōu)和評估能力;
3.有機器學習框架經(jīng)驗者優(yōu)先(TensorFlow/PyTorch);
4.有分布式訓練工具經(jīng)驗者優(yōu)先(Colossal-AI/DeepSpeed/Megatron)