【崗位職責】:
1.人工智能應用開發(fā):負責大模型智能體應用在業(yè)務場景中的開發(fā)工作,將大模型的能力與實際業(yè)務需求相結合,并結合視覺、語音、OCR等機器學習算法,構建構建智能體應用,負責智能體應用功能迭代和優(yōu)化,確保產品的技術領先性和用戶體驗;
2.模型開發(fā)與優(yōu)化:主導AI大模型及其他模型(大語言模型/視覺-語言模型)的訓練調優(yōu)及部署落地,針對業(yè)務場景優(yōu)化模型性能(推理速度、內存占用等),實現(xiàn)模型輕量化(如量化、剪枝、蒸餾),探索前沿技術(如MoE、RLHF、長上下文建模)提升模型效果;負責大模型的預訓練、微調及遷移學習,結合業(yè)務需求進行模型定制化開發(fā),提升模型在特定場景下的表現(xiàn)。
3.工程化支持:搭建高可用數(shù)據處理Pipeline(清洗、標注、增強),開發(fā)模型服務框架,支持高并發(fā)推理及動態(tài)擴縮容;與產品團隊協(xié)作,推動算法在業(yè)務場景中的落地,確保模型的高效部署和穩(wěn)定運行;
4.算法研究與落地:研發(fā)核心算法(如預訓練、提示工程、模型對齊),解決實際業(yè)務中的技術瓶頸,設計高效的分布式訓練方案(數(shù)據/模型并行),提升千億級參數(shù)模型的訓練效率;構建自動化評估體系,量化模型在垂類場景中的表現(xiàn),推動算法在搜索、推薦、對話等場景的落地;
5.技術前瞻性探索:跟蹤LLM、Agent、AIGC等領域最新進展,主導技術選型,參與開源社區(qū)貢獻,推動內部技術成果轉化;探索大模型與AI應用開發(fā)的前沿技術,推動技術創(chuàng)新和業(yè)務場景的結合。
【任職要求】:
1.學歷要求:研究生及以上學歷,(特別優(yōu)秀的本科也可以考慮),計算機/數(shù)學/AI相關專業(yè);
2.工作經驗:具備2年以上大模型實戰(zhàn)經驗(需提供項目細節(jié),如模型參數(shù)量、數(shù)據規(guī)模、性能指標),有完整參與從0到1的大模型訓練或產品算法落地案例;具備大規(guī)模分布式訓練經驗,熟悉數(shù)據并行、模型并行等訓練策略,能夠優(yōu)化千億級參數(shù)模型的訓練效率。
3.專業(yè)技能:精通Python編程語言,熟練使用PyTorch、PaddlePaddle等深度學習框架,具備CUDA優(yōu)化經驗;深入理解Transformer、Diffusion等模型原理及實現(xiàn)細節(jié),熟悉Megatron-LM、DeepSpeed、HuggingFace等開源生態(tài);熟悉大模型的訓練、微調及部署流程,具備模型輕量化(如量化、剪枝、蒸餾)經驗;
4.其他要求:具備技術抽象能力,能將業(yè)務問題轉化為可建模的算法問題,對技術敏感度高,能快速驗證新技術可行性;具備跨團隊協(xié)作經驗,能清晰傳遞技術價值至非技術人員,推動技術成果在業(yè)務場景中的落地。