崗位職責 :
1. 模型研究與算法驗證
- 負責大語言模型技術研究,主導模型訓練策略優(yōu)化及性能驗證,提升模型在復
雜場景下的準確性與魯棒性。
- 推進模型微調、量化壓縮、推理加速等技術落地,解決訓練過程中的工程難題
(如分布式并行、內存優(yōu)化)。
2. 數(shù)據(jù)與實驗管理
- 構建高質量訓練數(shù)據(jù)集,設計數(shù)據(jù)清洗、標注及合成方案,確保數(shù)據(jù)質量與多
樣性。
- 設計實驗方案并復現(xiàn)前沿模型,通過對比實驗驗證技術路線可行性。
3. 技術落地支持
- 協(xié)同團隊完成模型部署與調優(yōu),優(yōu)化推理延遲與吞吐量,支持端側/云端多場景 應用。
- 輸出技術文檔與專利,推動研究成果在智能數(shù)據(jù)治理、知識治理、文本挖掘、
人機交互等領域的商業(yè)化落地。
任職要求:
1. 教育背景
- 計算機科學、人工智能或相關專業(yè)碩士及以上學歷,有扎實的數(shù)學與算法基
礎。
2. 技術能力
- 精通PyTorch/TensorFlow等框架,熟悉DeepSpeed、LlamaFactory等分布式訓練 工具,掌握模型并行、流水線并行等優(yōu)化技術。
- 具備強化學習研究經驗,有頂會論文或開源項目貢獻者優(yōu)先。
3. 工程實踐
- 熟悉Linux系統(tǒng)與Docker或K8s,具備大規(guī)模數(shù)據(jù)處理與模型調優(yōu)經驗,能獨立解決GPU集群、網絡通信等工程問題。
4. 加分項
- 有數(shù)據(jù)治理、等垂直領域模型落地經驗者優(yōu)先。
- 熟悉模型可解釋性分析或自動化評測工具(如BLEU、ROUGE)優(yōu)先。