大模型研究員
崗位要求:
1、負責設計、開發(fā)和實現(xiàn)語言模型算法,包括文本生成、語義理解、機器翻譯,nl2sql等;
2. 負責預訓練模型的訓練加速。包括但不限于優(yōu)化Megatron,DeepSpeed,PyTorch等框架,數(shù)據(jù)讀取,網(wǎng)絡通信,計算算子等優(yōu)化方向;
3、從事語言模型算法訓練與調(diào)優(yōu),不斷提升算法精度和模型性能,推動語言模型算法在公司業(yè)務場景落地;
4、負責語言模型領域?qū)W術研究和前沿方向探索,實現(xiàn)技術突破,并將前沿算法技術轉化為創(chuàng)新產(chǎn)品。
任職要求:
1、碩士及以上學歷,計算機、數(shù)學、自然語言處理、人工智能等相關專業(yè),對語言模型算法有一定理解;
2、對預訓練模型技術有一定的理解,對于模型訓練、預測、服務化的加速有一定經(jīng)驗;
3、對前沿技術有濃厚興趣,有較強的學術研究能力,并善于利用各類技術解決復雜的實際問題,有良好的溝通表達能力;
4、頂級會議或期刊上發(fā)表過有影響力的學術論文或在重要算法比賽中取得過優(yōu)秀名次的候選人優(yōu)先;
5、參與過大規(guī)模語言模型項目及相關產(chǎn)品落地者優(yōu)先。
上海 - 長寧
上海從鯨信息技術有限公司上海 - 徐匯
上海 - 閔行
拔俗(上海)網(wǎng)絡技術有限公司上海 - 奉賢
上海 - 浦東
上海 - 虹口