崗位職責(zé):
收集和處理大規(guī)模的數(shù)據(jù)集,以滿(mǎn)足模型的輸入和輸出需求
使用先進(jìn)的優(yōu)化技術(shù),提高模型的訓(xùn)練速度和效果
評(píng)估和分析模型的性能、魯棒性、可解釋性和可擴(kuò)展性
跟蹤和掌握最新的大模型研究進(jìn)展和趨勢(shì)
負(fù)責(zé)AIGC相關(guān)研究包括但不限于大模型訓(xùn)練、微調(diào)、提示詞工程等在開(kāi)源的LLM等語(yǔ)言大模型、新的圖像生成模型如diffusion models、多模態(tài)生成模型等研發(fā)工作;
負(fù)責(zé)研發(fā)布署相關(guān)細(xì)節(jié),如指定場(chǎng)景的優(yōu)化提示詞與提供內(nèi)部文檔庫(kù)使得模型行為符合場(chǎng)景要求、根據(jù)特別場(chǎng)景的模型微調(diào)、模型蒸餾與量化、圖像生成模型針對(duì)特別場(chǎng)景的客制化等。
任職要求:
1、教育背景與專(zhuān)業(yè)技能: 計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)等相關(guān)專(zhuān)業(yè)碩士及以上學(xué)歷,具有扎實(shí)的理論基礎(chǔ)和實(shí)踐經(jīng)驗(yàn)。
2、工作經(jīng)驗(yàn)與技術(shù)棧: 至少有2年以上NLP領(lǐng)域相關(guān)工作經(jīng)驗(yàn),熟悉Transformer架構(gòu),具備Bert、GPT、T5等大型預(yù)訓(xùn)練模型的應(yīng)用經(jīng)驗(yàn)。
3、情感分析與知識(shí)圖譜構(gòu)建: 具備情感分析系統(tǒng)的搭建和維護(hù)經(jīng)驗(yàn),了解如何構(gòu)建、維護(hù)和應(yīng)用知識(shí)圖譜于實(shí)際產(chǎn)品中。
4、語(yǔ)音識(shí)別與信號(hào)處理: 掌握語(yǔ)音識(shí)別的基本原理和技術(shù),包括特征提取、聲學(xué)建模、語(yǔ)言模型以及喚醒詞識(shí)別等關(guān)鍵技術(shù)環(huán)節(jié)。
5、模型微調(diào)與遷移學(xué)習(xí): 熟悉模型微調(diào)和遷移學(xué)習(xí)方法,在特定任務(wù)上能夠快速調(diào)整和優(yōu)化現(xiàn)有模型以滿(mǎn)足特定應(yīng)用場(chǎng)景的需求。
6、編程與工具使用: 精通Python編程,熟悉深度學(xué)習(xí)框架如TensorFlow、PyTorch,以及數(shù)據(jù)處理庫(kù)如Pandas、NumPy等。
7、硬件資源優(yōu)化意識(shí): 了解嵌入式系統(tǒng)特性,具有將復(fù)雜模型部署到低功耗嵌入式平臺(tái)上的實(shí)戰(zhàn)經(jīng)驗(yàn)。
8、團(tuán)隊(duì)協(xié)作與溝通能力: 良好的跨團(tuán)隊(duì)協(xié)作能力,能有效與前端、后端開(kāi)發(fā)、嵌入式開(kāi)發(fā)、產(chǎn)品經(jīng)理等角色協(xié)同工作,共同推進(jìn)項(xiàng)目的順利實(shí)施。