職位職責(zé):
1. 開發(fā)并優(yōu)化面向司法信息化場景的語音解決方案,包括語音識別、語音合成、硬件適配與實時處理框架搭建。
2. 主導(dǎo)語音識別系統(tǒng)在復(fù)雜聲學(xué)環(huán)境(如庭審現(xiàn)場、調(diào)解場景)的落地調(diào)優(yōu),設(shè)計噪音抑制、聲源分離等技術(shù)方案。
3. 沉淀跨場景的語音解決方案,支持智能外呼、庭審輔助等核心業(yè)務(wù)的技術(shù)突破。
4. 跟進國際前沿語音技術(shù)(包含多模態(tài)大模型),主導(dǎo)關(guān)鍵技術(shù)創(chuàng)新與知識產(chǎn)權(quán)布局。
任職要求:
1. 碩士及以上學(xué)歷,計算機/電子工程/通信工程等相關(guān)專業(yè),2年以上工業(yè)級語音算法研發(fā)經(jīng)驗。
2. 深入理解語音識別全鏈路技術(shù)棧。
3. 熟練使用Kaldi、Whisper等語音框架和模型以及原理,掌握Pytorch/Tensorflow。
4. 具備落地經(jīng)驗者優(yōu)先,熟悉司法行業(yè)語音特征者優(yōu)先。
技術(shù)加分項:
· 在ICASSP/Interspeech/ASRU發(fā)表語音相關(guān)論文
· 有法庭庭審、多人對話場景語音識別項目落地經(jīng)驗
· 具備邊緣計算部署經(jīng)驗,熟悉模型量化壓縮技術(shù)。
南京 - 鼓樓
南京 - 鼓樓
南京 - 棲霞