更新于 2月18日

大模型推理加速算法專家

2-2.5萬
  • 南昌東湖區(qū)
  • 5-10年
  • 本科
  • 全職
  • 招1人

職位描述

崗位職責:
1. 負責語言、語音大模型在云端和終端的工程優(yōu)化和落地部署,通過量化、壓縮、蒸餾等技術(shù),降低模型部署所需資源,提高模型推理性能;
2. 在多種計算平臺(如GPU,TPU等)上進行分布式部署和優(yōu)化不同參數(shù)尺寸的大模型,重點解決性能瓶頸,包括但不限于計算時間、顯存占用量、計算功耗等;
3. 探索和實施常見推理加速技術(shù),包括網(wǎng)絡(luò)架構(gòu)、基本算子、模型推理框架等,跟蹤最新的研究成果和技術(shù)趨勢,將業(yè)界的推理加速成果應(yīng)用于生產(chǎn)環(huán)境。

任職要求:
1、本科及以上學歷,擁有8年以上相關(guān)工作經(jīng)驗。
2、精通C/C++,精通算法與數(shù)據(jù)結(jié)構(gòu),熟悉Python。
3、熟悉常用的推理加速框架和方法,熟悉vLLM、蒸餾、剪枝、量化、continue batch等。
4、熟練GPU的高性能計算優(yōu)化技術(shù),深入理解計算機體系結(jié)構(gòu),熟悉并行計算優(yōu)化、訪存優(yōu)化,低比特計算等;
5、具備自我驅(qū)動力、創(chuàng)新能力、團隊協(xié)作能力、溝通能力和抗壓能力。
6、有CUDA編程經(jīng)驗,能夠在CUDA層面進行優(yōu)化設(shè)計與實現(xiàn)的,優(yōu)先。
7、熟悉ONNX、OpenVino、TensorRT、NCNN等推理或加速框架者優(yōu)先。
8、擁有大模型云端及邊緣端推理加速優(yōu)化項目經(jīng)驗者優(yōu)先。

工作地點

西格瑪國際商務(wù)中心15樓

職位發(fā)布者

宋先生/人事經(jīng)理

立即溝通
江西金融發(fā)展集團股份有限公司
江西金融發(fā)展集團于2016年6月成立,是經(jīng)江西省人民政府批復同意,由擁有十多年中小微金融服務(wù)經(jīng)驗的行業(yè)龍頭企業(yè)——江西漢辰投資集團牽頭,聯(lián)合贛州市屬國企贛州發(fā)展投資控股集團、省屬國企江西日報傳媒集團等共同發(fā)起設(shè)立,注冊資本金為10億元,計劃三年內(nèi)增至30-50億元。作為我省金融服務(wù)行業(yè)的新興力量,江西金融發(fā)展集團定位于打造成綜合金融服務(wù)與類金融投資控股平臺。公司將充分結(jié)合貸款、融資租賃、商業(yè)保理、產(chǎn)業(yè)投資基金、資產(chǎn)證券化等多種金融服務(wù)工具,建立圍繞實體企業(yè)、小貸公司、傳統(tǒng)金融機構(gòu)、公共服務(wù)機構(gòu)等多種主體的投融資服務(wù)相關(guān)業(yè)務(wù)體系,成為銀行、證券、保險、信托、融資租賃、股權(quán)基金投資等跨界多種金融服務(wù)的實施主體。公司是我省底層金融資產(chǎn)的組織者及培育者,金融資產(chǎn)端的運營者及交易者,區(qū)域公共服務(wù)機構(gòu)金融資源整合的組織者及參與者,將逐步發(fā)展為省內(nèi)各類金融機構(gòu)的投資母平臺,促進區(qū)域金融服務(wù)實現(xiàn)跨越式新發(fā)展。
公司主頁