工作職責:
1、負責公司算力平臺的搭建、部署、監(jiān)控、調優(yōu)、升級、日常維護等工作;
2、參與公司算力平臺運維流程、制度和規(guī)范的制訂;
3、參與公司算力平臺監(jiān)控體系和應急響應機制的建立;
4、參與公司算力平臺自動化運維工具的設計和實施;
5、參與算力類服務的客戶交流,開展需求分析,提供解決方案和技術支撐;
6、持續(xù)跟蹤和研究最前沿的算力平臺維護和應用技術,開展相關技術創(chuàng)新;
7、參與各類保障和維護工作。
崗位要求:
1、計算機、通信等相關專業(yè)背景;
2、具有云平臺維護、云平臺搭建和業(yè)務遷云等相關工作經驗;
3、熟悉云計算主要技術架構和技術特點,了解openstack云平臺運維體系,容器和k8s等容器管理架構的運維體系,熟悉相關虛擬化技術;
4、熟悉Linux操作,了解Ansible,Terraform等自動化運維開源工具;
5、熟練使用Python語言,熟練掌握深度學習框架PyTorch,掌握機器學習、深度學習等算法原理,精通一種Web開發(fā)框架(例如django、flask等);
6、熟悉不同算力芯片的基本概念,了解人工智能開發(fā)框架的基本邏輯。