1.負責算力平臺系統(tǒng)的部署和運維部署工作;
2.負責算力平臺的軟件安裝部署工作。
3.負責算力集群的運維工作;
4.完成工作報告等文檔;
5.完成領導交辦的其他任務
基本要求:
1.熟悉Linux系統(tǒng)原理與Shell,能分析、解決系統(tǒng)運行中的常見問題;
2.了解HPC集群架構,包括網絡、存儲、計算、調度等;
3.安裝和使用過slurm、PBS、LSF等至少一種調度器;
4.熟練使用python、go等腳本語言;
5.有HPC集群運維經驗,有HPC應用軟件安裝經驗;
6.本科及以上學歷,計算機等相關專業(yè);
7.有K8S運維管理經驗者優(yōu)先。