国产三级网站在线观看-免费国产白袜踩踏视频区-免费黄片视频大全在线观看-97精品人妻无码在线视频

更新于 9月9日

運(yùn)維工程師

1.2-1.5萬(wàn)
  • 深圳南山區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招1人

職位描述

服務(wù)器運(yùn)維系統(tǒng)運(yùn)維數(shù)據(jù)庫(kù)運(yùn)維C++JavaPython計(jì)算機(jī)軟件云計(jì)算/大數(shù)據(jù)網(wǎng)絡(luò)/信息安全
崗位職責(zé)
1.負(fù)責(zé)人力資源業(yè)務(wù)系統(tǒng)的穩(wěn)定性建設(shè),如WEB服務(wù)、APP后端、API網(wǎng)關(guān)、用戶(hù)行為日志等;構(gòu)造和維護(hù)高可用、可擴(kuò)展的服務(wù)架構(gòu),提升系統(tǒng)容災(zāi)能力和故障恢復(fù)效率;
2.設(shè)計(jì)并實(shí)現(xiàn)自動(dòng)化監(jiān)控、告警、發(fā)布、擴(kuò)縮容等系統(tǒng)運(yùn)維流程,深度參與CI/CD流水線設(shè)計(jì)與優(yōu)化,推動(dòng)DevOps和自動(dòng)化落地;
3.負(fù)責(zé)大模型訓(xùn)練與推理所需的 GPU 服務(wù)器及 CPU 服務(wù)器的日常運(yùn)維工作,包括服務(wù)器的環(huán)境配置、部署、監(jiān)控、故障排查與修復(fù),保障服務(wù)器硬件設(shè)備穩(wěn)定運(yùn)行。
4.制定并執(zhí)行服務(wù)器定期巡檢計(jì)劃,記錄巡檢數(shù)據(jù),分析潛在風(fēng)險(xiǎn),提前預(yù)警并解決服務(wù)器性能瓶頸、硬件故障等問(wèn)題,確保服務(wù)器資源利用率達(dá)到最優(yōu)水平。
5.負(fù)責(zé)企業(yè)應(yīng)用相關(guān)服務(wù)的安全防護(hù)工作,制定并落實(shí)服務(wù)器安全策略,包括操作系統(tǒng)安全加固、賬號(hào)權(quán)限管理、防火墻配置、數(shù)據(jù)備份與恢復(fù)方案等,防范網(wǎng)絡(luò)攻擊、數(shù)據(jù)泄露等安全風(fēng)險(xiǎn)。
6.監(jiān)控服務(wù)器運(yùn)行狀態(tài),實(shí)時(shí)跟蹤服務(wù)響應(yīng)時(shí)間、并發(fā)量、錯(cuò)誤率等關(guān)鍵指標(biāo),當(dāng)服務(wù)出現(xiàn)異常時(shí),快速定位問(wèn)題根源,協(xié)調(diào)相關(guān)資源進(jìn)行緊急處理,保障服務(wù)可用性與穩(wěn)定性,降低服務(wù)中斷時(shí)長(zhǎng)。
7.參與制定服務(wù)應(yīng)急預(yù)案,定期組織應(yīng)急演練,提升團(tuán)隊(duì)?wèi)?yīng)對(duì)突發(fā)故障的能力,確保在極端情況下能快速恢復(fù)大模型服務(wù)運(yùn)行。
8.編寫(xiě)運(yùn)維工具、腳本及技術(shù)分享文檔。
任職要求
1.學(xué)歷與專(zhuān)業(yè):計(jì)算機(jī)科學(xué)與技術(shù)、電子信息工程、軟件工程等相關(guān)專(zhuān)業(yè),3 年及以上服務(wù)器運(yùn)維或后端開(kāi)發(fā)相關(guān)工作經(jīng)驗(yàn)。
2.服務(wù)器運(yùn)維能力:熟悉 GPU 服務(wù)器(NVIDIA 系列優(yōu)先)及 CPU 服務(wù)器的硬件架構(gòu)與工作原理,掌握服務(wù)器運(yùn)維常用工具(如 Ansible、Prometheus、Grafana 等)的使用方法,具備獨(dú)立完成服務(wù)器故障排查與修復(fù)的能力。
3.操作系統(tǒng)與網(wǎng)絡(luò)知識(shí):熟悉 Linux系統(tǒng)原理,熟悉 TCP/IP 協(xié)議棧,具備網(wǎng)絡(luò)故障排查能力,了解防火墻、負(fù)載均衡等網(wǎng)絡(luò)設(shè)備的配置與使用。
4.編程與工具能力:具備扎實(shí)的編程基礎(chǔ),熟練至少一種主流編程語(yǔ)言如C/C++、Python、Shell 等;熟悉 Docker 容器技術(shù);
5.安全意識(shí)與應(yīng)急處理:具備強(qiáng)烈的服務(wù)安全意識(shí),熟悉常見(jiàn)的網(wǎng)絡(luò)安全威脅與防護(hù)措施,掌握數(shù)據(jù)備份與恢復(fù)方法;具備良好的應(yīng)急處理能力,能夠在服務(wù)出現(xiàn)故障時(shí)快速響應(yīng)、高效解決問(wèn)題。
6.溝通與協(xié)作:具備良好的溝通表達(dá)能力與團(tuán)隊(duì)協(xié)作精神,能夠清晰準(zhǔn)確地與跨部門(mén)團(tuán)隊(duì)溝通技術(shù)需求與解決方案,積極配合團(tuán)隊(duì)完成項(xiàng)目任務(wù);具備較強(qiáng)的學(xué)習(xí)能力與抗壓能力,能夠快速適應(yīng)新技術(shù)、新業(yè)務(wù),應(yīng)對(duì)工作中的挑戰(zhàn)。
加分項(xiàng):
1. 熟悉vLLM、SGLang等推理框架,有AI模型部署和運(yùn)維工程落地經(jīng)驗(yàn);
2. 能獨(dú)立完成服務(wù)器性能測(cè)試,熟悉軟件測(cè)試的流程與方法

工作地點(diǎn)

深圳南山區(qū)曙光大廈1212

職位發(fā)布者

何世聰/人事經(jīng)理

立即溝通