一、崗位職責:
負責垂直行業大模型的設計、訓練、調優與部署;
研究并實現面向特定行業的預訓練和微調方法,提升模型在具體場景下的性能;
構建高質量的行業數據集,完成數據清洗、標注、增強等工作;
參與模型壓縮、蒸餾、量化、推理加速等優化工作;
與部門經理、業務團隊協作,推動AI模型在實際業務中的落地應用;
跟蹤前沿研究,持續優化模型效果,提升系統整體智能化水平。
二、任職要求:
教育背景:
計算機科學、人工智能、數學、電子工程等相關專業;
技術能力:
精通Python編程語言,熟悉TensorFlow/PyTorch等深度學習框架;
熟悉Transformer架構及各類預訓練模型(如BERT、GPT、LLaMA、ChatGLM等);
有大規模語言模型訓練、微調、評估經驗,掌握LoRA、Adapter、Prompt Tuning等參數高效訓練方法;
熟悉分布式訓練技術(如DeepSpeed、Megatron-LM、Horovod等),具備多GPU/TPU集群使用經驗;
具備良好的算法基礎和扎實的機器學習/深度學習理論功底;
熟悉常見的模型評估指標(BLEU、ROUGE、F1、AUC等)和調優策略;
有數據處理、文本生成、對話系統、知識融合、意圖理解等相關項目經驗者優先。
工程能力:
熟悉Linux環境開發,了解Docker、Kubernetes等容器化部署工具;
有將模型部署上線的實際經驗,熟悉ONNX、Triton、TensorRT等推理引擎者優先;
有良好的代碼規范和文檔習慣,具備一定的工程交付能力。
項目經驗:
至少參與過2個以上完整的大模型訓練或調優項目,有從0到1構建模型的經驗;
有垂直行業(如金融、醫療、教育、政務等)模型定制化訓練經驗者優先;
軟技能:
具備良好的溝通能力和團隊合作精神;
對AI技術有強烈興趣,關注行業動態,有自我驅動力;
能夠獨立思考并解決復雜問題,具備較強的邏輯思維能力;
英文文獻閱讀能力強,能快速復現最新研究成果。
三、加分項:
有NLP、CV、語音識別或跨模態研究背景者優先。
熟悉Agent、RAG、檢索增強生成、多模態模型等技術;
有開源社區貢獻經歷(如HuggingFace、GitHub等);
熟悉AutoML、超參調優、模型監控、A/B測試等全流程;