職位描述
基礎研發平臺是美團的核心技術平臺,立足于“零售+科技”的戰略定位,通過打造人工智能、大數據、云計算、安全等核心技術能力,以及研發效能平臺、企業應用平臺等公共服務,為業務提供穩定安全、擴展易用、技術領先的平臺技術和產品服務。
在這里,我們會參與到最前沿的技術研發和探索;能夠接觸超規模集群、海量數據,挑戰高復雜業務場景,有機會與業界一流的工程師一起并肩前行。
在這里,我們有超強的技術氛圍,持續向社區貢獻業界實踐,加速行業技術發展;我們有完善的互聯網學習生態圈,重視底層邏輯和方法論,助力職業生涯的非線性成長。
真誠地邀請你,和我們一起驅動技術發展,創造行業價值。
崗位職責
主要負責多模態大模型(不限于視覺/語音專家模型與全模態融合模型)的模型能力分析,并且對訓練數據、策略和模型能力之間的關系進行研究分析,產出可行的模型評測方案和訓練策略,具體工作內容包括但不限于:
1. 追蹤多模態大模型方向的前沿進展,積極學習新的模型結構、前沿模型認知,并進行深入分析。
2. 積極探索業界前沿的生成與理解多模大模型進展,深入理解模型結構與訓練過程,設定合理的模型訓練效果分析方法和評測方案。
3. 結合評測結果,對模型的訓練數據、策略和結構等進行深入分析,指導評測方案迭代以及訓練策略優化。
4. 與各相關部門保持良好溝通,深度參與多模態模型的訓練過程,共同推動多模態大模型持續優化。
崗位基本需求
1. 碩士及以上學歷,計算機、數學、統計學或相關專業。
2. 熟悉Java/Python/C++等編程語言,良好的編碼習慣和一定的工程能力 。
3. 具有視覺/語音算法的基礎知識,熟練掌握多模態大模型相關算法和模型。
4. 良好的溝通能力、團隊合作精神以及較強的問題解決能力。
5. 對每一行代碼負責,對業務方負責,具備工匠精神。
具備以下者優先
1. 在計算機領域頂會(如CVPR、ECCV,ICCV,ACL,NeurIPS,AAAI等)上以一作發表過論文者優先。
2. 有視覺/語音等模態相關工作或算法研究經驗者優先;
3. 對多模理解生成統一大模型有深入了解者優先;
崗位亮點
1. 緊跟人工智能行業進展,接觸到前沿技術和行業趨勢,磨練出對人工智能的獨到見解;
2. 參與大模型的訓練與評測的全流程,了解從理論到工程實踐的全面技能;
3. 與一流的人工智能團隊合作,快速成長,提升自身能力;
4. 有機會參與公司的創新項目,跨足不同領域,拓寬人工智能技術的應用范圍;