職位描述
基礎研發平臺是美團的核心技術平臺,立足于“零售+科技”的戰略定位,通過打造人工智能、大數據、云計算、安全等核心技術能力,以及研發效能平臺、企業應用平臺等公共服務,為業務提供穩定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發和探索;能夠接觸超規模集群、海量數據,挑戰高復雜業務場景,有機會與業界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續向社區貢獻業界實踐,加速行業技術發展;我們有完善的互聯網學習生態圈,重視底層邏輯和方法論,助力職業生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發展,創造行業價值。
崗位職責
負責圍繞AI大模型的模型評測與模型研究工作,具體工作內容包括但不限于:
1. 深入理解大規模語言模型的模型結構、訓練過程以及評測方式,根據模型的訓練過程以及評測結果,對大語言模型存在的問題進行研究。
2. 深入分析模型效果不符合認知的異常,根據具體的異常制定完善的研究策略,通過對比、歸納等方法,產出研究分析結論,探索突破性的優化方案,帶來模型效果的迭代和突破。
3. 構建Data-Centric的數據-訓練-評測閉環,探索研究包括但不限于下列方向:大模型數據、模型的Scaling Law,研究數據配比、加入方式與時機等對模型效果的影響。
4. 追蹤大模型方向的前沿進展,積極主動地學習和探索新數據分析、模型訓練以及模型評測方法。
5. 與各相關部門保持良好溝通,深度參與大模型預訓練、SFT、RLHF和評測等階段,共同推動大模型持續優化。
崗位基本需求
1. 碩士及以上學歷,計算機、數學、統計學或相關專業;
2. 熟悉Java/Python/C++等編程語言,良好的編碼習慣和一定的工程能力,對每一行代碼負責,具備工匠精神;
3. 具有較強的算法研究經驗與能力,熟練掌握自然語言處理、多模態或大模型相關算法和模型;
4. 具備良好的綜合素質,包括溝通能力、團隊合作精神以及較強的應對復雜問題的解決能力。
具備以下者優先
1. 在計算機領域頂會(如ICLR、NeurIPS、AAAI、WWW、ACL等)上以一作發表過論文者優先;
2. 具備從事相關行業人工智能開發、算法研究等相關工作經驗者優先;
3. 對ChatGPT等相關大模型有深入了解或豐富的使用經驗者優先;
崗位亮點
1. 緊跟人工智能行業進展,接觸到前沿技術和行業趨勢,磨練出對人工智能的獨到見解;
2. 參與AI大模型的訓練與評測的全流程,了解從理論到工程實踐的全面技能;
3. 與一流的人工智能團隊合作,快速成長,提升自身能力;
4. 有機會參與公司的創新項目,跨足不同領域,拓寬人工智能技術的應用范圍;