崗位職責:
1. 負責將大模型技術應用于垂直行業,推動大模型技術發揮業務價值,并提供可規模復制的產品解決方案。
2. 負責對特定場景下大模型訓練和推理優化,負責RAG、AI Agent等相關算法的應用落地。
3. 追蹤學術界和工業界在大模型預訓練、微調、強化學習、知識蒸餾等方向的前沿進展,并進行持續創新和優化。
4. 與團隊成員緊密合作,共同解決大模型產業落地過程中的算法和技術難題,提高團隊整體技術水平。
5. 跟蹤行業動態,了解競爭對手的技術發展,為公司的發展提供戰略建議。
6. 撰寫技術文檔,分享研究成果和經驗,幫助團隊共同成長。
崗位要求:
1. 計算機科學、人工智能或相關領域本科及以上學歷,3年以上算法工作經驗;
2. 熟悉DeepSeek、Qwen、Llama等主流大模型原理,熟悉大模型增強預訓練、微調、強化學習、數據清洗、Prompt、RAG、Agent等相關技術;
3. 具備扎實的數學和編程基礎,熟練掌握Python/Java/C++等至少一種編程語言,TensorFlow/PyTorch等至少一種深度學習框架