一、崗位職責(zé)
1.基于DeepSeek等先進(jìn)大模型架構(gòu),研發(fā)多模態(tài)融合算法,提升模型在跨模態(tài)理解、生成和推理任務(wù)中的性能,并開發(fā)多模態(tài)交互式應(yīng)用(如智能問答、文檔解析、圖表生成等),增強(qiáng)用戶與系統(tǒng)的交互能力。
2.探索大模型的高效訓(xùn)練與微調(diào)技術(shù),優(yōu)化模型參數(shù)、推理速度和資源消耗,并協(xié)同工程團(tuán)隊(duì)完成模型部署和性能調(diào)優(yōu),確保模型在工業(yè)場(chǎng)景中的高效落地與服務(wù)高可用。
3.構(gòu)建結(jié)合大模型的數(shù)據(jù)分析與知識(shí)挖掘系統(tǒng),支持復(fù)雜業(yè)務(wù)場(chǎng)景下的數(shù)據(jù)洞察、智能決策與自動(dòng)化報(bào)告生成,并與產(chǎn)品、業(yè)務(wù)團(tuán)隊(duì)合作,推動(dòng)AI能力在風(fēng)險(xiǎn)識(shí)別、數(shù)據(jù)分析平臺(tái)和企業(yè)知識(shí)庫等場(chǎng)景中的應(yīng)用。
4.設(shè)計(jì)并實(shí)現(xiàn)基于大模型的知識(shí)問答系統(tǒng),融合RAG和知識(shí)圖譜等技術(shù),提升問答的準(zhǔn)確性、可解釋性和實(shí)時(shí)性,并針對(duì)垂直領(lǐng)域構(gòu)建領(lǐng)域知識(shí)庫,優(yōu)化模型對(duì)專業(yè)知識(shí)的理解與推理能力。
5.跟蹤LLM、多模態(tài)和數(shù)據(jù)分析領(lǐng)域的前沿技術(shù)(如GPT-4、Gemini、Diffusion Models等),推動(dòng)算法創(chuàng)新與專利產(chǎn)出,解決實(shí)際場(chǎng)景中的性能瓶頸與長(zhǎng)尾問題。
二、任職要求
1.本科以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè),3年以上算法研發(fā)經(jīng)驗(yàn)。
2.深入理解大模型技術(shù)(如Transformer、BERT、GPT等),熟悉多模態(tài)模型及數(shù)據(jù)分析技術(shù)棧(Pandas、NumPy、SQL)。
3.精通Python/C++,熟練使用PyTorch/TensorFlow等框架,具備大模型分布式訓(xùn)練、量化壓縮等優(yōu)化經(jīng)驗(yàn),熟悉Docker、Kubernetes及云平臺(tái)部署。
4.有知識(shí)問答系統(tǒng)開發(fā)經(jīng)驗(yàn),熟悉知識(shí)圖譜構(gòu)建、數(shù)據(jù)分析及BI工具集成,能設(shè)計(jì)自然語言交互式數(shù)據(jù)分析方案。
5.具備極強(qiáng)的邏輯思維能力和跨團(tuán)隊(duì)溝通能力,能獨(dú)立解決復(fù)雜技術(shù)問題并將業(yè)務(wù)需求轉(zhuǎn)化為技術(shù)方案。
6.有頂會(huì)論文發(fā)表、開源項(xiàng)目貢獻(xiàn)或垂直領(lǐng)域知識(shí)建模經(jīng)驗(yàn)者優(yōu)先。
注:項(xiàng)目周期為3-6個(gè)月,有意向者請(qǐng)投遞。