?1、大模型底層技術(shù)研究:深入研究大模型的核心算法(如Transformer、LoRA、MoE等)、優(yōu)化策略和訓(xùn)練方法,探索新型架構(gòu)和技術(shù)創(chuàng)新。
2、模型性能優(yōu)化:研究大模型的高效訓(xùn)練與推理方法,包括分布式訓(xùn)練、參數(shù)高效化、稀疏化等技術(shù),提升模型性能與資源利用率。
3、技術(shù)難點(diǎn)攻關(guān):解決大模型底層技術(shù)中的關(guān)鍵問(wèn)題,探索模型在多模態(tài)、跨領(lǐng)域等場(chǎng)景中的應(yīng)用潛力。
4、技術(shù)輸出與分享:撰寫(xiě)高質(zhì)量的技術(shù)論文、專利或技術(shù)報(bào)告,參與國(guó)內(nèi)外頂級(jí)學(xué)術(shù)會(huì)議或行業(yè)論壇,分享研究成果。
?任職要求:
1、學(xué)歷要求:計(jì)算機(jī)、人工智能、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相關(guān)專業(yè)博士學(xué)歷,2025年應(yīng)屆畢業(yè)生。
2、研究背景:在大模型、深度學(xué)習(xí)、分布式計(jì)算或相關(guān)領(lǐng)域有深入研究,發(fā)表過(guò)高水平論文(如NeurIPS、ICLR、CVPR、ACL等)。
3、技術(shù)能力: 1)熟悉主流大模型架構(gòu)(如GPT、BERT、T5等)及其底層實(shí)現(xiàn)原理。 2)熟練掌握深度學(xué)習(xí)框架(如PyTorch、TensorFlow)及分布式訓(xùn)練工具(如DeepSpeed、Horovod)。 3)具備扎實(shí)的算法基礎(chǔ),熟悉模型壓縮、量化、蒸餾等優(yōu)化技術(shù)。
4、編程能力:精通Python,熟悉C++或CUDA者優(yōu)先。
5、創(chuàng)新能力:對(duì)技術(shù)研究有強(qiáng)烈興趣,具備獨(dú)立思考和創(chuàng)新能力,能夠快速學(xué)習(xí)和解決復(fù)雜問(wèn)題。
6、團(tuán)隊(duì)協(xié)作:具備良好的溝通能力和團(tuán)隊(duì)合作精神,能夠與跨部門團(tuán)隊(duì)高效協(xié)作。 加分項(xiàng): 1)有大規(guī)模分布式訓(xùn)練或超大規(guī)模模型部署經(jīng)驗(yàn)。 2)熟悉大模型在多模態(tài)、跨語(yǔ)言或行業(yè)應(yīng)用中的研究方向。 3)參與過(guò)開(kāi)源大模型項(xiàng)目(如Hugging Face、OpenAI等)或有相關(guān)貢獻(xiàn)。
人力資源服務(wù)許可認(rèn)證
人力資源服務(wù)許可證是由國(guó)家人力資源與社會(huì)保障相關(guān)部門頒發(fā),代表人才經(jīng)紀(jì)人所在企業(yè)可以合法開(kāi)展人力資源相關(guān)業(yè)務(wù)的資質(zhì)證件。展示該標(biāo)簽代表該企業(yè)發(fā)布此職位時(shí)已上傳《人力資源服務(wù)許可證》或《人力資源服務(wù)備案證書(shū)》并經(jīng)由平臺(tái)審驗(yàn)通過(guò)。
上海 - 長(zhǎng)寧
上海 - 靜安
上海 - 楊浦
大連良機(jī)予人管理咨詢有限公司上海 - 浦東
廣州秒到信息科技有限公司上海 - 浦東
上海 - 徐匯
大連良機(jī)予人管理咨詢有限公司