職位描述:
1.專注于對T0B各類型復雜文本數(shù)據(jù)(文本分類、信息抽取、總結要等)按照訓練需求進行標注、分析和驗證調優(yōu),為LLM 訓練打造高質量訓練類據(jù)集。
2.依據(jù)模型B端場錄的特點和要求,制定并持續(xù)優(yōu)化數(shù)據(jù)標注的標準與流程,保障標注準確性與實驗有效性。
3.與算法團隊、產品團隊等密切協(xié)作,深度理解項目在T0B方向的需求以及模型的特點,積極提供有針對性的數(shù)據(jù)合成策略和建議。
4.能夠完成數(shù)據(jù)挖掘、預處理和清洗工作,閉環(huán)驗證數(shù)據(jù)在模型實驗上的有效性,提升數(shù)據(jù)在模型T0B場景能力上的可用性與價值。
職位要求:
1.理工科背景,邏輯性好,畢業(yè)院校985211、雙一流必須項。
2.具有 LLM 數(shù)據(jù)標注經驗,熟悉 LLM 數(shù)據(jù)標注的流程和方法。曾參與大型語言模型白創(chuàng)作方向數(shù)據(jù)標注最佳。
3.具有 prompt engineering 驗,了解如何設計有效的提示詞以引導模型生成期望自輸出?;蛘咴趯嵺`中積累了對不同類型模型和任務的rompt 優(yōu)化經驗。
4.對新技術和新領域保持強烈的學習熱情,能夠快速適應不斷變化的標注任務和要求。
5工作細致認真,責任心強,具備優(yōu)秀的團隊協(xié)作精神和良好的溝通能力