崗位職責:
1、大語言模型研發
設計并實現大語言模型(LLM)的技術方案,推動其在行業客戶的垂直場景中落地應用,包括多輪對話、文檔問答(Document QA)、結構化信息抽取、工具調用等;
熟悉指令微調(Instruction Tuning)與LoRA訓練,針對行業需求調整模型效果;
關注大語言模型及相關領域的最新研究進展,將前沿技術應用于模型優化與訓練。
2、數據分析與建模
針對多種業務場景,開展結構化與抽象數據的建模與分析,包括時序數據預測、異常檢測、根因分析及多維數據建模;
運用數學建模方法與深度學習算法,解決復雜數據場景中的預測與優化問題。
3、模型訓練調優與部署
負責模型研發全流程,包括數據集構建、模型訓練調優,以及模型輕量化部署與性能優化;
持續改進模型表現,提升模型的準確性與泛化能力,為生產場景提供穩定可靠的算法支持。
崗位要求:
1、至少3年算法研發經驗,扎實的機器學習與深度學習理論基礎;
2、熟練掌握Python或C++編程,具備獨立開發高效算法的能力;
3、熟悉主流深度學習框架(如TensorFlow、PyTorch),并具備多機多卡訓練和模型量化部署的實際經驗;
4、優秀的邏輯分析能力,能夠快速定位并解決復雜問題;
5、熱愛技術創新,具備較強的學習能力和良好的團隊協作精神。