職位描述
? 負責大模型基模及系統效果評估,能夠設計并執行針對大模型的評測方案
? 負責多模態大模型評測工作包括對圖文、音頻和視頻的模型評測
? 負責Badcase分析、Benchmark引入、平臺對接以及多模態體驗評測數據集的構建
? 持續優化編碼風格和技術能力提升,推動團隊技術能力的持續提升
? 對技術有熱情,樂于接受挑戰和學習新技術
職位要求:
? 本科或以上學歷,計算機科學、人工智能、數學或相關專業
? 熟練掌握Python語言,具備扎實的代碼編寫能力
? 熟悉SQL、pandas等數據處理
? 熟悉PyTorch深度學習框架
? 具備完整AI項目評測經驗,包括評測方案設計、評測集構建、效果評估
? 熟練掌握Prompt工程,能通過Prompt設計解決復雜任務,有實際案例者優先
? 有出色的問題解決能力和團隊合作精神,有良好的溝通能力和項目管理能力