崗位職責
1、核心職責:研究確定大模型產品和項目技術路線;編制大模型項目技術方案;
2、負責大模型核心技術研發工作,包括模型訓練、模型微調、模型推理、模型評測、模型安全、模型輕量化等圍繞大模型全鏈條的工具集和服務研發;
3、負責大模型訓練、推理等計算過程對國產或異構算力資源的適配;
4、負責實現大模型分布式并行訓練,并對硬件算力資源進行統一調度;
5、負責對垂直領域行業大模型訓練提供支撐保障。
任職資格
1.計算機科學或人工智能等相關專業,碩士及以上學歷;
2.有深度學習領域知識背景,了解基本的深度學習原理,熟悉常用的深度學習框架,如TensorFlow、PyTorch等;
3.熟悉Linux開發環境,具有良好的編程能力,熟悉計算機相關基礎知識,至少掌握以下一種編程語言:python/go/java;
4.熟悉大模型訓練、微調等環節的原理和方法;
5.了解大規模分布式訓練基本方法,了解混合精度訓練、數據并行等訓練加速方法;
6.了解高性能計算、GPU計算、GPU-CPU混合計算、云計算等;
7.有激情,責任心強,具有分析問題和解決問題的能力,具備良好的團隊合作精神和溝通能力。
加分項:
1.有深度學習框架的研究或開發經驗者優先;
2.有大規模AI訓練和推理經驗者優先;
3.有大模型管理平臺開發經驗者優先;
4.熟悉DeepSpeed、Colossal-AI 等分布式并行訓練框架者優先;
5.985/211院校計算機/自動化/人工智能/遙感/地信等相關專業碩士/博士優先。