崗位職責
1.基于DeepSeek等先進大模型架構,研發(fā)多模態(tài)融合算法,提升模型在跨模態(tài)理解、生成和推理任務中的性能,并開發(fā)多模態(tài)交互式應用(如智能問答、文檔解析、圖表生成等),增強用戶與系統(tǒng)的交互能力。
2.探索大模型的高效訓練與微調技術,優(yōu)化模型參數(shù)、推理速度和資源消耗,并協(xié)同工程團隊完成模型部署和性能調優(yōu),確保模型在工業(yè)場景中的高效落地與服務高可用。
3.構建結合大模型的數(shù)據(jù)分析與知識挖掘系統(tǒng),支持復雜業(yè)務場景下的數(shù)據(jù)洞察、智能決策與自動化報告生成,并與產品、業(yè)務團隊合作,推動AI能力在風險識別、數(shù)據(jù)分析平臺和企業(yè)知識庫等場景中的應用。
4.設計并實現(xiàn)基于大模型的知識問答系統(tǒng),融合RAG和知識圖譜等技術,提升問答的準確性、可解釋性和實時性,并針對垂直領域構建領域知識庫,優(yōu)化模型對專業(yè)知識的理解與推理能力。
5.跟蹤LLM、多模態(tài)和數(shù)據(jù)分析領域的前沿技術(如GPT-4、Gemini、Diffusion Models等),推動算法創(chuàng)新與專利產出,解決實際場景中的性能瓶頸與長尾問題。
崗位能力要求
1.本科以上學歷,計算機科學、人工智能、數(shù)學等相關專業(yè),3年以上算法研發(fā)經(jīng)驗。
2.深入理解大模型技術(如Transformer、BERT、GPT等),熟悉多模態(tài)模型及數(shù)據(jù)分析技術棧(Pandas、NumPy、SQL)。
3.精通Python/C++,熟練使用PyTorch/TensorFlow等框架,具備大模型分布式訓練、量化壓縮等優(yōu)化經(jīng)驗,熟悉Docker、Kubernetes及云平臺部署。
4.有知識問答系統(tǒng)開發(fā)經(jīng)驗,熟悉知識圖譜構建、數(shù)據(jù)分析及BI工具集成,能設計自然語言交互式數(shù)據(jù)分析方案。
5.具備極強的邏輯思維能力和跨團隊溝通能力,能獨立解決復雜技術問題并將業(yè)務需求轉化為技術方案。
6.有頂會論文發(fā)表、開源項目貢獻或垂直領域知識建模經(jīng)驗者優(yōu)先。