工作職責
1.負責模型訓練、效果優(yōu)化、模型評估、部署、調用和監(jiān)控工作;
2.熟悉 Prompt 工程,能夠撰寫對話和賦能團隊成員;
3.掌握大模型的 Langchain 框架相關技術;
4.獨立系統(tǒng)分析設計文檔編寫能力和 Agent 架構設計能力,以達到 Agent 應用 + 模型意圖效果;
5.設計和構建數(shù)據(jù)集,進行模型訓練和調優(yōu),以滿足業(yè)務需求的目標;
職位要求
1.本科以上學歷,計算機相關等 3T 專業(yè),精通 Python 與 Java 編程語言;
2.精通 RAG 技術,精通大模型 Prompting 工程與 Agent 開發(fā);
3.熟悉使用向量數(shù)據(jù)庫(如 FAISS、Milvus、Annoy 等),能夠處理大規(guī)模向量數(shù)據(jù);
4.熟悉知識召回和 Rerank 模型優(yōu)化算法,LoRA 模型微調,有對話系統(tǒng)、自然語言處理(NLP)項目經(jīng)驗;
5.扎實的 NLP 理論基礎,對 CNN、LSTM/GRU、Transformer、BERT 等 NLP 基礎技術有深入了解。
6.熟悉vLLM等推理框架
7.有大模型訓練與微調經(jīng)驗,包括 RLHF(強化學習人類反饋),以及對話系統(tǒng)開發(fā)背景優(yōu)先;