職位描述
職責描述:1. 主導AI業(yè)務場景下Kubernetes調(diào)度系統(tǒng)的戰(zhàn)略規(guī)劃與架構(gòu)設計,支撐生成式AI、多模態(tài)模型訓練、智能體協(xié)同等核心業(yè)務需求。 2. 構(gòu)建面向AI工作負載的調(diào)度范式,解決模型開發(fā)、部署、持續(xù)迭代全生命周期的資源動態(tài)編排問題。 3. 深入理解AI業(yè)務特征,設計資源調(diào)度策略與業(yè)務指標的聯(lián)動機制。 4. 構(gòu)建跨集群/跨云的智能調(diào)度中臺,支持混合云、邊緣計算等新興AI業(yè)務場景。 5 主導AI調(diào)度能力的產(chǎn)品化封裝,為AI平臺、AI智能體等上層業(yè)務提供標準化資源治理能力。任職要求: 1. 統(tǒng)招本科以上學歷,人工智能、計算機及相關專業(yè),技術基礎扎實,5年以上云原生架構(gòu)經(jīng)驗,至少2年專注AI/ML場景的基礎設施建設。 2. 主導過AI業(yè)務關鍵路徑的調(diào)度系統(tǒng)設計,如支持千卡規(guī)模訓練任務調(diào)度、實時推理資源保障等。 3. 深入理解AI業(yè)務全流程(數(shù)據(jù)準備、訓練調(diào)優(yōu)、推理部署),具備將業(yè)務需求轉(zhuǎn)化為基礎設施設計的能力。 4. 精通Kubernetes調(diào)度領域核心方法論,對資源隔離、優(yōu)先級搶占、彈性伸縮等機制有體系化認知。 5. 具備架構(gòu)級抽象能力,能設計兼顧通用性與AI場景特性的調(diào)度解決方案。 優(yōu)先: 1. 熟悉AI技術演進趨勢(如MoE架構(gòu)、Agent群體智能),能預判其對基礎設施的新要求。 2. 具備技術產(chǎn)品化思維,能通過調(diào)度能力輸出提升AI業(yè)務迭代速度與資源使用效率。
企業(yè)介紹
曙光信息產(chǎn)業(yè)股份有限公司(以下簡稱“中科曙光”)作為我國核心信息基礎設施企業(yè),為中國及全球用戶提供創(chuàng)新、高效、可靠的IT產(chǎn)品、解決方案及服務。 公司于2014年在上海證券交易所上市(股票代碼:603019)。經(jīng)歷20余年發(fā)展,中科曙光在高端計算、存儲、安全、數(shù)據(jù)中心等領域擁有深厚的技術積淀和市場份額,并充分發(fā)揮高端計算優(yōu)勢,布局智能計算、云計算、大數(shù)據(jù)等領域的技術研發(fā),打造計算產(chǎn)業(yè)生態(tài),為科研探索創(chuàng)新、行業(yè)信息化建設、產(chǎn)業(yè)轉(zhuǎn)型升級、數(shù)字經(jīng)濟發(fā)展提供了堅實可信的支撐。 中科曙光在全國各省、自治區(qū)和直轄市均設立了分支機構(gòu),擁有國際的3大智能制造生產(chǎn)基地、5大研發(fā)中心,在全國50多個城市部署了城市云計算中心。 作為以技術創(chuàng)新為基因的科技企業(yè),中科曙光未來將持續(xù)專注于核心技術研發(fā),并與用戶、合作伙伴攜手共建應用生態(tài)、推動產(chǎn)業(yè)進步,以科技創(chuàng)新助力“數(shù)字中國”建設,驅(qū)動經(jīng)濟高質(zhì)量發(fā)展。