職位描述
1、負責大語言模型相關技術(知識注入、指令對齊、深度推理、知識圍欄等)的算法研究和應用落地,具備自然語言處理、對話系統、語義理解、文本檢索,強化學習等方向的研發經驗。
2、參與對話意圖、對話管理、對話生成、人機協同、知識檢索、情感分析等場景的模型的訓練和迭代,包括數據清洗、微調、測試;
3、積極探索前沿技術并結合旅游業務場景微調大模型,提高大模型在特定任務上的泛化效果。
4、開展開源大模型應用落地探索與開發部署,尤其是與旅游業務結合的應用落地。
5、參與業務知識庫、大模型文本生成、智能問答、知識圖譜等應用構建。
6、負責對模型進行微調與優化,包括主流大模型 Qwen、DeepSeek 等;使用 Dify、Langchain、Ollama 等 AI 開發工具,運用 LORA 等技術優化模型性能。
7、關注大模型前沿技術,跟進業內最新研究進展和應用趨勢,提出創新思路和方向。參與對業務數據進行挖掘,完成大模型訓練數據集的建設等。
職位要求
1、3年及以上工作經驗,碩士及博士研究生學歷;
2、具有良好的深度學習/自然語言處理/自然語言生成等相關理論基礎,有 AI 產品或 NLP 應用開發經驗者、頂會論文發表者優先;
3、有一定的數學建模和優化能力,能根據具體業務設計調整模型,具有大模型的微調、增量預訓練、對齊以及部署加速等相關經驗;
4、熟悉BERT/lama/qwen-vl/intern-vl等主流大模型,熟悉Pytorch、TensorFlow等主流的深度學習訓練框架,熟悉常用的大模型加速推理框架(VLLM,TensorRT-LLM)等;
5、具備AIGC、對話問答、大模型部署、多模態模型開發全流程(數據采標清洗、模型設計調優、性能評測等)、分布式訓練及部署等經驗者優先。
6、熟悉主流大模型(如 GPT、Gemini、LLaMA、Claude、DeepSeek 等)工作原理及應用,熟悉 Dify、Langchain、Ollama 等一種或多種主流開源 LLM/Agent 應用開發框架,有實際大模型調優 / 應用經驗者(Prompt tuning、prefix tuning、LORA 等一種即可)優先。
7、具有良好的團隊協作和溝通能力,能夠解決復雜問題,抗壓能力強。