崗位職責:
1、結合實際業務場景,規劃設計AI產品中智能語言理解交互的技術方案;
2、負責大語言模型及多模態大模型的研發與優化,包括但不限于模型訓練調優、推理加速等工作,提升模型在政務相關場景的性能;
3、負責跟進領域最新進展,探索將前沿的算法應用于實際業務,包括不僅限于Agent、多輪對話、圖像識別的研發落地工作。
崗位要求:
1、本科及以上學歷,三年以上工作經驗,計算機相關專業,深刻理解計算機原理,有良好的數據結構和算法基礎,有扎實的編程能力;
2、對傳統和前沿的NLP/LLM、機器學習、數據挖掘等相關技術都有深刻的了解和相關項目經驗(包括但不限于Transformer、BERT、GPT等),對DeepSeek-R1所使用技術有較深理解或者實踐者優先;
3、對CV領域有深入的理解,在多模態模型(LLaVa、InternVL、Qwen2.5-VL等)有深入的研究經歷者優先;
4、具有在大模型訓練、微調方面的實戰經驗,熟練使用Python或者C++等編程語言,熟悉主流深度學習框架(如PyTorch、TensorFlow等),具有較強的算法工程落地能力和經驗;
5、有大模型推理加速經驗者優先,包括但不限于vLLM、SGLang等;
6、熟悉Al Agent的原理和應用,有相關項目開發經驗者優先;
7、學習能力強,邏輯思維清晰,較強的文獻閱讀能力,有較強的自我驅動力和問題解決能力,有軟件工程能力者優先;
8、要求抗壓能力強,樂于主動分享和溝通技術。