上海創(chuàng)芯學(xué)院(籌)(以下簡(jiǎn)稱“學(xué)院”)定位為一所服務(wù)國(guó)家戰(zhàn)略需求,創(chuàng)新人才培養(yǎng)模式,匯聚高校、企業(yè)、產(chǎn)線資源的新型研發(fā)機(jī)構(gòu)。學(xué)院由復(fù)旦大學(xué)、上海交通大學(xué)和上??萍即髮W(xué)共同參與創(chuàng)建。學(xué)院將與合作雙一流高校聯(lián)合授予學(xué)位,借助錯(cuò)位優(yōu)勢(shì)與兄弟高校形成補(bǔ)位發(fā)展,打造具有創(chuàng)新活力和自主獨(dú)立特色的樞紐型產(chǎn)教融合平臺(tái)。學(xué)院將作為國(guó)家創(chuàng)新體系中的關(guān)鍵接口,承擔(dān)起體制機(jī)制探索、高端資源配置與領(lǐng)軍人才培育的三重歷史使命。學(xué)院將集中力量培養(yǎng)具備全流程實(shí)戰(zhàn)能力、能夠定義未來(lái)工藝路線的復(fù)合型設(shè)計(jì)人才,以及能夠深刻理解工藝極限、能夠通過(guò)架構(gòu)創(chuàng)新挖掘工藝潛力,并能提出極致PPA(性能、功耗、面積)需求的設(shè)計(jì)領(lǐng)軍人才。
崗位名稱:高性能計(jì)算工程師
崗位人數(shù):1
崗位職責(zé):
1.負(fù)責(zé)學(xué)院HPC/智算平臺(tái)的規(guī)劃、建設(shè)、運(yùn)維與優(yōu)化。
2.負(fù)責(zé)CPU+GPU異構(gòu)計(jì)算資源、存儲(chǔ)系統(tǒng)及高速互聯(lián)網(wǎng)絡(luò)的部署、配置、巡檢、監(jiān)控和故障處理。
3.負(fù)責(zé)作業(yè)調(diào)度系統(tǒng)、訓(xùn)練框架、推理引擎、容器環(huán)境等基礎(chǔ)平臺(tái)的部署和維護(hù)。
4.負(fù)責(zé)并行文件系統(tǒng)、分布式存儲(chǔ)及集群監(jiān)控告警體系建設(shè)。
5.負(fù)責(zé)AI模型訓(xùn)練、推理環(huán)境部署及相關(guān)應(yīng)用支撐,配合科研和教學(xué)場(chǎng)景落地。
6.負(fù)責(zé)平臺(tái)的制度規(guī)范的建設(shè),安全管理、用戶支持、培訓(xùn)推廣。
7.完成領(lǐng)導(dǎo)交辦的其他工作。
招聘條件:
1.具有計(jì)算機(jī)、人工智能、科學(xué)計(jì)算、軟件工程、電子信息等相關(guān)專業(yè)碩士及以上學(xué)歷。
2.熟悉Linux系統(tǒng),具備Shell/Python腳本能力。
3.熟悉作業(yè)調(diào)度系統(tǒng)(Slurm/PBS/LSF等)、容器環(huán)境及基礎(chǔ)軟件平臺(tái)運(yùn)維。
4.熟悉并行文件系統(tǒng)、分布式存儲(chǔ)或高速互聯(lián)網(wǎng)絡(luò)(InfiniBand/RoCE)技術(shù)。
5.熟悉Prometheus、Grafana等監(jiān)控工具。
6.具備良好的溝通協(xié)作能力、服務(wù)意識(shí)和責(zé)任心,能適應(yīng)應(yīng)急保障工作安排。
7.了解深度學(xué)習(xí)框架、模型訓(xùn)練與推理部署,有AI平臺(tái)或大模型應(yīng)用支撐經(jīng)驗(yàn)者優(yōu)先。
8.具有5年以上超算中心、智算中心或大型數(shù)據(jù)中心工作經(jīng)驗(yàn),2年以上團(tuán)隊(duì)管理經(jīng)驗(yàn)者優(yōu)先。
工作條件與工資待遇
按照上海創(chuàng)芯學(xué)院(籌)相關(guān)規(guī)定執(zhí)行,根據(jù)個(gè)人具體情況,提供具有競(jìng)爭(zhēng)力的薪酬、津貼和福利。
應(yīng)聘方式
請(qǐng)應(yīng)聘者填寫(xiě)完整的應(yīng)聘材料,通過(guò)上海科技大學(xué)人才招聘系統(tǒng)提交應(yīng)聘申請(qǐng),不接受現(xiàn)場(chǎng)應(yīng)聘。