崗位職責:
1、負責大模型(如GPT、BERT、LLaMA等)的應用開發(fā)、微調(diào)和優(yōu)化;
2、根據(jù)業(yè)務需求,設計和實現(xiàn)基于大模型的解決方案,如文本生成、對話系統(tǒng)、知識問答等;
3、針對特定領(lǐng)域或場景,進行大模型的微調(diào)(Fine-tuning)和提示工程(Prompt Engineering);
4、開發(fā)基于大模型的知識庫構(gòu)建、檢索增強生成(RAG)系統(tǒng)及相關(guān)應用;
5、研究并探索大模型在不同業(yè)務場景中的創(chuàng)新性應用;
6、優(yōu)化大模型的推理性能,降低資源消耗,提升響應速度;
7、跟蹤大模型領(lǐng)域的最新研究進展,并將新技術(shù)應用到實際項目中;
8、與產(chǎn)品、數(shù)據(jù)團隊協(xié)作,完成模型部署和效果評估。
任職要求:
1、學歷要求:計算機科學、人工智能、數(shù)學、統(tǒng)計學等相關(guān)專業(yè)碩士及以上學歷。
2、工作經(jīng)驗:3年以上機器學習/深度學習相關(guān)經(jīng)驗,1年以上大模型應用或微調(diào)經(jīng)驗。
3、技術(shù)要求:
(1)熟悉深度學習框架(如PyTorch、TensorFlow),具備扎實的編程能力(Python為主);
(2)熟悉常見的大模型架構(gòu)(如Transformer、GPT、BERT等),了解其原理和實現(xiàn)細節(jié);
(3)具備大模型微調(diào)經(jīng)驗,熟悉LoRA、P-Tuning、Adapter等微調(diào)技術(shù);
(4)熟悉提示工程(Prompt Engineering)和少樣本學習(Few-shot Learning);
(5)熟悉大模型的推理優(yōu)化技術(shù),如量化、剪枝、蒸餾等技術(shù),能夠優(yōu)化模型性能并降低資源消耗。
(6)熟悉常見的NLP任務,如文本分類、命名實體識別、文本生成、對話系統(tǒng)等;
(7)了解分布式訓練和推理框架(如DeepSpeed、Megatron-LM);
(8)最好有基于大模型的實際業(yè)務應用開發(fā)經(jīng)驗,能夠?qū)⒛P湍芰D(zhuǎn)化為可落地的產(chǎn)品或服務;
(9)熟練使用Java或Python開發(fā)服務端應用,熟悉FastAPI或其他類似框架。
4、個人素質(zhì):
具備良好的溝通能力和團隊協(xié)作精神;
有較強的學習能力和解決問題的能力;
對技術(shù)有熱情,能夠主動關(guān)注新技術(shù)并應用到工作中。
5、加分項:
有大模型部署經(jīng)驗,熟悉ONNX、TensorRT等推理加速工具;
有實際的大規(guī)模數(shù)據(jù)處理和清洗經(jīng)驗;
在大模型領(lǐng)域有相關(guān)論文發(fā)表、專利申請或技術(shù)創(chuàng)新經(jīng)驗或在頂級會議(如NeurIPS、ICML、ACL等)發(fā)表過相關(guān)論文;
熟悉多模態(tài)大模型(如圖文生成、視頻理解等)。