職位亮點
深度參與AI大模型本地化部署前沿項目,協(xié)同開發(fā)DeepSeek-671B定制化一體機;
核心職責
1.硬件選型與部署
負責數(shù)據(jù)中心服務(wù)器、GPU算力卡、存儲設(shè)備的選型論證及采購評測,輸出硬件兼容性報告;
主導新服務(wù)器上架部署,包括RAID配置、BIOS/UEFI調(diào)優(yōu)、硬件級故障診斷與備件更換。
2.算力集群運維
支持AI訓練/推理服務(wù)器(含DeepSeek一體機)的硬件調(diào)優(yōu),監(jiān)控GPU顯存利用率及散熱性能;
制定IDC機房硬件巡檢標準,設(shè)計服務(wù)器生命周期管理方案(退役/擴容決策)。
3.技術(shù)支持與優(yōu)化
協(xié)助AI研發(fā)團隊完成大模型本地部署的算力驗證,排查硬件資源瓶頸;
編寫硬件運維手冊及故障應急處理SOP,定期組織技術(shù)內(nèi)部分享。
4.新技術(shù)研究
跟蹤國產(chǎn)化服務(wù)器及AI加速芯片發(fā)展趨勢,主導新硬件適配性測試(如華為昇騰系列)。
任職要求
硬性條件:
1、本科及以上學歷,計算機、電子工程或相關(guān)專業(yè),5年以上服務(wù)器硬件運維經(jīng)驗;
2、精通Intel/AMD CPU體系架構(gòu),掌握主流GPU(NVIDIA/海光DCU,華為910B)的硬件特性及監(jiān)測工具;
3、熟悉服務(wù)器BMC/iLO管理,能獨立完成硬盤背板/電源模組,內(nèi)存,顯卡更換及固件升級;
4、具備Linux基礎(chǔ)運維能力(Ubuntu/CentOS),了解基礎(chǔ)腳本編寫(Bash/Python);
優(yōu)選條件(滿足任意1項):
1、有AI算力集群(百卡級)部署經(jīng)驗或HPC高性能計算項目背景;
2、持有OCP/CCNP數(shù)據(jù)中心認證或NVIDIA DLI AI基礎(chǔ)設(shè)施證書;
3、熟悉國產(chǎn)化服務(wù)器(浪潮/華為)或DeepSeek LLM一體機運維邏輯。
4、形象氣質(zhì)佳。
薪資待遇面議!