聲明:本站部分公告與職位內(nèi)容由本站根據(jù)官方招聘公告進行整理編輯。由于用人單位需求專業(yè)、學歷學位、資格條件、職位編制、備注內(nèi)容等內(nèi)容情況復雜且有變化可能,是否符合招聘條件以用人單位公告為準或請聯(lián)系用人單位確認。本站整理編輯的職位信息僅供求職者參考,如因此造成的損失本站不承擔任何責任!
職位詳情
基本信息
職位名稱:研究員/副研究員(AI Infra)
工作地點:廣東深圳
招聘人數(shù): 若干
報名方式:
站內(nèi)投遞
截止時間:詳見正文
其他要求
學歷要求:博士研究生
工作經(jīng)驗:1-3年
崗位職責
1、負責大模型系統(tǒng)架構(gòu)創(chuàng)新與性能優(yōu)化,研究分布式訓練框架(Megatron-LM、DeepSpeed、Colossal-AI 等),設計模型并行、流水線并行、MoE、長上下文、RL 訓推一體等高效擴展方案,提升千億級大模型訓練效率與穩(wěn)定性。
2、開展大模型推理與工程化研究,優(yōu)化低延遲、高吞吐推理體系(動態(tài)批處理、KV Cache、量化、模型壓縮、動態(tài)加載等),搭建輕量化部署、服務化框架與高效微調(diào)工具鏈,支持邊緣與云端場景落地。
3、深耕軟硬件協(xié)同設計,針對GPU、國產(chǎn)算力芯片(昇騰、寒武紀等)及RDMA等硬件特性進行深度適配與調(diào)度優(yōu)化,攻克顯存瓶頸、通信開銷、算子/編譯優(yōu)化等關鍵工程問題。
4、探索前沿系統(tǒng)技術方向,包括稀疏化訓練、低精度計算、綠色AI、多模態(tài)大模型系統(tǒng)等,并推動技術方案工程化落地。
5、開展高水平學術研究與產(chǎn)學研合作,在系統(tǒng)/ML 頂會發(fā)表論文,參與開源社區(qū)建設,聯(lián)合產(chǎn)業(yè)伙伴推進技術成果轉(zhuǎn)化與應用落地。
任職要求
1、熟練掌握 PyTorch/TensorFlow 等主流深度學習框架,熟悉大模型訓練、調(diào)試與推理部署全流程,具備分布式訓練實戰(zhàn)經(jīng)驗。
2、深入理解 Transformer、RLHF、推理加速等大模型核心技術,掌握 CUDA/MPI/NCCL/RDMA 等并行與分布式技術,或熟悉 TVM/XLA/LLVM 等編譯優(yōu)化、高性能計算(HPC)原理。
3、具備系統(tǒng)開發(fā)能力,熟悉 C++/Rust等高性能編程語言,有大型AI系統(tǒng)或底層優(yōu)化相關開發(fā)經(jīng)驗。
4、在 MLSys/OSDI/PPoPP/NeurIPS/ICML等系統(tǒng)或AI頂會發(fā)表論文者優(yōu)先。
優(yōu)先條件
1、參與過 Megatron-LM、ColossalAI、vLLM、Verl 等主流開源項目并具備代碼貢獻;
2、熟悉模型量化、蒸餾、剪枝等 LLM 壓縮技術,或具備 Triton 算子、芯片級優(yōu)化、國產(chǎn)芯片適配經(jīng)驗;
3、有云廠商大規(guī)模AI系統(tǒng)部署、主導開源項目或核心專利成果;
4、國際頂級編程/AI競賽獲獎。
其他說明
福利待遇保障
1、提供具有競爭力的薪酬待遇和福利,特別優(yōu)秀者可一人一議。
2、提供覆蓋全城的免費班車,員工通勤無憂。
3、年度體檢、佳節(jié)禮包、生日驚喜等福利拉滿。
4、子女入學、提供香港中文大學(深圳)附屬幼兒園、小學、初中。
附件下載
您與該職位匹配度: ***,已超過了
*** 的競爭者,建議************
您在 ?位置
歡迎掃描下方二維碼關注高校人才網(wǎng)官方微信(碩博QQ交流群:928126168 ,進微信群
請點擊添加官方客服號)
重要風險提示:如招聘單位在招聘過程中向求職者提出收取押金、保證金、體檢費、材料費、成本費,或指定醫(yī)院體檢等,求職者有權要求招聘單位出具物價部門批準的收費許可證明材料,若無法提供相關證明,請求職者提高警惕,有可能屬于詐騙或違規(guī)行為。