更新于 2025-02-25 01:09:01

大模型底層研究工程師--TCL

5-8萬(wàn)
  • 上海浦東新區(qū)
  • 經(jīng)驗(yàn)不限
  • 博士
  • 全職
  • 招10人

職位描述

CUDATensorFlowPyTorchC++GPTBERT
工作職責(zé)

?1、大模型底層技術(shù)研究:深入研究大模型的核心算法(如Transformer、LoRA、MoE等)、優(yōu)化策略和訓(xùn)練方法,探索新型架構(gòu)和技術(shù)創(chuàng)新。

2、模型性能優(yōu)化:研究大模型的高效訓(xùn)練與推理方法,包括分布式訓(xùn)練、參數(shù)高效化、稀疏化等技術(shù),提升模型性能與資源利用率。

3、技術(shù)難點(diǎn)攻關(guān):解決大模型底層技術(shù)中的關(guān)鍵問(wèn)題,探索模型在多模態(tài)、跨領(lǐng)域等場(chǎng)景中的應(yīng)用潛力。

4、技術(shù)輸出與分享:撰寫(xiě)高質(zhì)量的技術(shù)論文、專利或技術(shù)報(bào)告,參與國(guó)內(nèi)外頂級(jí)學(xué)術(shù)會(huì)議或行業(yè)論壇,分享研究成果。

?任職要求:

1、學(xué)歷要求:計(jì)算機(jī)、人工智能、數(shù)學(xué)、統(tǒng)計(jì)學(xué)或相關(guān)專業(yè)博士學(xué)歷,2025年應(yīng)屆畢業(yè)生。

2、研究背景:在大模型、深度學(xué)習(xí)、分布式計(jì)算或相關(guān)領(lǐng)域有深入研究,發(fā)表過(guò)高水平論文(如NeurIPS、ICLR、CVPR、ACL等)。

3、技術(shù)能力: 1)熟悉主流大模型架構(gòu)(如GPT、BERT、T5等)及其底層實(shí)現(xiàn)原理。 2)熟練掌握深度學(xué)習(xí)框架(如PyTorch、TensorFlow)及分布式訓(xùn)練工具(如DeepSpeed、Horovod)。 3)具備扎實(shí)的算法基礎(chǔ),熟悉模型壓縮、量化、蒸餾等優(yōu)化技術(shù)。

4、編程能力:精通Python,熟悉C++或CUDA者優(yōu)先。

5、創(chuàng)新能力:對(duì)技術(shù)研究有強(qiáng)烈興趣,具備獨(dú)立思考和創(chuàng)新能力,能夠快速學(xué)習(xí)和解決復(fù)雜問(wèn)題。

6、團(tuán)隊(duì)協(xié)作:具備良好的溝通能力和團(tuán)隊(duì)合作精神,能夠與跨部門團(tuán)隊(duì)高效協(xié)作。 加分項(xiàng): 1)有大規(guī)模分布式訓(xùn)練或超大規(guī)模模型部署經(jīng)驗(yàn)。 2)熟悉大模型在多模態(tài)、跨語(yǔ)言或行業(yè)應(yīng)用中的研究方向。 3)參與過(guò)開(kāi)源大模型項(xiàng)目(如Hugging Face、OpenAI等)或有相關(guān)貢獻(xiàn)。


工作地點(diǎn):深圳/上海--TCL鴻鵠實(shí)驗(yàn)室

工作地點(diǎn)

上海浦東軟件園(祖沖之園)-X座上海-上海-浦東新區(qū)-張江-亮秀路-72號(hào)102室

入職公司信息

  • 入職公司: 某大型公司
  • 公司地址: 北京石景山區(qū)
  • 公司人數(shù): 1000-9999人

認(rèn)證資質(zhì)

  • 人力資源服務(wù)許可認(rèn)證

    人力資源服務(wù)許可證是由國(guó)家人力資源與社會(huì)保障相關(guān)部門頒發(fā),代表人才經(jīng)紀(jì)人所在企業(yè)可以合法開(kāi)展人力資源相關(guān)業(yè)務(wù)的資質(zhì)證件。展示該標(biāo)簽代表該企業(yè)發(fā)布此職位時(shí)已上傳《人力資源服務(wù)許可證》或《人力資源服務(wù)備案證書(shū)》并經(jīng)由平臺(tái)審驗(yàn)通過(guò)。

職位發(fā)布者

張卓雄/招聘專員

昨日活躍
立即溝通