職位描述:
1、負責通用多模態(tài)大模型(包括十億、百億參數(shù)量)的設計、開發(fā)和優(yōu)化,包括但不限于預訓練、跨模態(tài)信息對齊方法探索、SFT、指令微調、RLHF、Prompt工程、模型評估、模型推理等;
2、負責大規(guī)模、多模態(tài)數(shù)據(jù)的獲取,清洗和質量控制,保障數(shù)據(jù)質量和有效性;
3、緊跟業(yè)界大模型、多模態(tài)/語言等方向進展,探密前沿技術,形成系列算法/大模型解決方案,完成算法團隊研發(fā)落地工作,推動多模態(tài)大模型效果達到行業(yè)領先。
任職要求:
1、碩士及以上優(yōu)先,代碼能力極強者放寬要求;計算機科學,軟件專業(yè);
2、精通Transformer、Bert、ViT等深度學習理論算法和優(yōu)化;
3、對多模態(tài)大模型訓練范式等有深入理解和實踐,有多機多卡大模型訓練/大模型微調/從0到1構建多模態(tài)大模型(百億參數(shù)以上)等經(jīng)驗者優(yōu)先;
4、對大模型和生成式AI有濃厚的興趣,對至少一項生成式模型的原埋與應用具有深入了解,如GPT4V、LLaVa、MiniGPT4、Stable Difusion、CogVLM、DALL-E等;
5、精通一種或多種編程語言,如python、C語言等,熟練握主流深度學習框架Pytorch、Tensorflow等;熟悉Linux系統(tǒng),了解分布式訓練框架,如Deepspeed和Meatron-LM等,并有一定的多機多卡分布式訓練經(jīng)驗;
6、具有部署經(jīng)驗,有模型壓縮經(jīng)驗以及端側部署經(jīng)驗優(yōu)先;
7、具備較強的團隊協(xié)作能力和溝通能力,有較強的學習能力和業(yè)務分析及問題解決能力;
8、發(fā)表過大模型相關研究AI頂會論文優(yōu)先;具有影響力競賽,如CVPR,Kaggle,排名靠前成績優(yōu)先。