更新于 1月10日

算力算法運維經(jīng)理

2.5萬-3.5萬
  • 北京豐臺區(qū)
  • 10年以上
  • 本科
  • 全職
  • 招1人

職位描述

大模型算法IDCGPU算力算法IT運維經(jīng)理數(shù)據(jù)中心智算PDMA網(wǎng)絡/交換機運維體系,運維流程,運維管理,ITR,信息中心經(jīng)理
崗位工作概述:
1、組織統(tǒng)籌各專業(yè)主管工程師,編制本數(shù)據(jù)中心的IT質量管理體系技術文檔,包括IT設施 MOP 、 SOP 、 EOP ;
2、組織落實IT質量管理制度及流程,存檔各種形式的設備資料、圖紙、培訓文檔、運維記錄等;
3、組織帶領各專業(yè)主管工程師,定期開展風險及缺陷的識別與評估活動;
4、硬件監(jiān)控與維護:GPU集群安裝與維護,管理BMC + IPMI硬件報警系統(tǒng),建立和維護硬件告警工單體系。負責機器內硬件固件的升級維護、問題定位,進行硬件/BIOS性能調優(yōu)。監(jiān)控和維護RDMA網(wǎng)絡/交換機,調整水線,進行故障定位。 軟件運維:負責監(jiān)控、日志、存儲、工單系統(tǒng)組件的搭建及運維管理;
5、IDC管理:負責IDC的備件庫存管理,確保7*24小時oncall響應,處理機房問題(如斷電、溫度過高等),協(xié)調廠商上門升級服務,對故障機器組件(如網(wǎng)卡、主板、光模塊、線纜)進行更換和維修。
任職要求
工作經(jīng)驗:
1、有帶領團隊維護大型GPU服務器集群三年以上工作經(jīng)驗;
2、有大規(guī)模智算集群早期或中期搭建運維經(jīng)歷,全鏈路細節(jié)經(jīng)驗豐富。
教育水平要求:本科及以上學歷,有IT網(wǎng)絡相關專業(yè)畢業(yè)。
崗位技能要求:
1、熟悉任職崗位及下屬崗位的各項業(yè)務及運作流程;
2、熟悉行業(yè)標準及規(guī)章制度;
3、具有較強的管理能力和領導水平;
4、能夠依照運維體系中的各項要求完成、指導相關工作;
5、具備較強的計劃、組織、領導、協(xié)調、控制、督導能力;
6、有較高的職業(yè)素質、責任感,良好的管理理念、服務意識、應急處理能力,為人熱忱有禮,工作仔細認真。
工作技能要求:
1、取得國家及相關設備廠商專業(yè)機構頒發(fā)的行業(yè)許可證;
2、有帶領團隊維護大型GPU服務器集群三年以上工作經(jīng)驗;
3、有大規(guī)模智算集群早期或中期搭建運維經(jīng)歷,全鏈路細節(jié)經(jīng)驗豐富;
4、有強大的問題協(xié)調解決和應急處理能力。
5、能出色的帶領團隊完成工作任務,具備嫻熟的溝通技巧能夠和各業(yè)務方進行無障礙溝通。
6、具備持續(xù)學習新技術的熱情和能力,具有英文讀寫各種指令和一定的英文口語能力。

工作地點

金唐西聯(lián)大廈

職位發(fā)布者

鐘女士/人事經(jīng)理

三日內活躍
立即溝通
嘉合通盈(北京)科技產業(yè)發(fā)展有限公司
嘉合通盈(北京)科技產業(yè)發(fā)展有限公司是國內領先的大數(shù)據(jù)、AIDC算力運營服務商。企業(yè)以“助力數(shù)字強國,算力賦能產業(yè)”為使命,構建國內領先的智能運算環(huán)境,形成集算力資源、應用資源、服務資源和人才資源于一體的超算云服務平臺。公司核心團隊具備豐富的AIDC行業(yè)經(jīng)驗,已構建一套企業(yè)獨有的項目開發(fā)、建設、運營、銷售、融資完整的業(yè)務模式,服務客戶超過2000家。我們致力于成為世界領先的算力服務供應商,為人工智能、科研教育、智能制造、生命科學等領域的用戶,持續(xù)提供高質量、高性能、高性價比的算力服務。
公司主頁