崗位職責(zé)
1、大模型部署與優(yōu)化:負(fù)責(zé)NLP/多模態(tài)大模型(如LLaMA、DeepSeek、CLIP、BLIP等)的端到端部署,支持云服務(wù)、邊緣計(jì)算等場(chǎng)景;使用TensorRT/ONNX/FastDeploy等工具優(yōu)化模型推理性能,實(shí)現(xiàn)低延遲、高吞吐的工業(yè)級(jí)部署。
2、多模態(tài)系統(tǒng)開發(fā):構(gòu)建視覺-語(yǔ)言聯(lián)合推理系統(tǒng)(能夠完成多模態(tài)大模型的訓(xùn)練、微調(diào)與應(yīng)用);實(shí)現(xiàn)多模態(tài)任務(wù)的服務(wù)化封裝(RESTful API、GRPC等)。
3、工程化落地:設(shè)計(jì)大模型輕量化方案(量化、蒸餾、剪枝),推動(dòng)十億級(jí)參數(shù)模型在移動(dòng)端/嵌入式設(shè)備落地;開發(fā)自動(dòng)化部署流水線,支持多硬件平臺(tái)(NVIDIA/華為昇騰/寒武紀(jì))適配。
任職要求
1、計(jì)算機(jī)/數(shù)學(xué)/電子工程相關(guān)專業(yè),碩士及以上學(xué)歷(能力突出者可放寬)
2、熟悉主流大模型架構(gòu)(Transformer、ViT),掌握PyTorch/TensorFlow框架
3、具備以下至少一項(xiàng)實(shí)戰(zhàn)經(jīng)驗(yàn):
多模態(tài)任務(wù):圖文檢索(CLIP)、視覺問答(BLIP)、開放詞匯檢測(cè)(GLIP);
模型部署工具鏈:ONNX Runtime、TensorRT、Triton Inference Server;
性能優(yōu)化技術(shù):算子融合、內(nèi)存復(fù)用、混合精度推理。
有以下經(jīng)驗(yàn)者可優(yōu)先考慮
1、在GitHub貢獻(xiàn)過模型部署相關(guān)開源項(xiàng)目(如優(yōu)化kernel、部署工具插件)
2、發(fā)表過ACL/ICML/CVPR等頂會(huì)論文,或Kaggle/天池競(jìng)賽TOP10
3、熟悉大模型服務(wù)化框架(vLLM、TGI、FastAPI)
成都 - 武侯
成都 - 武侯
成都
成都 - 武侯
成都 - 雙流
成都 - 武侯