崗位職責:
1.負責主流大模型(如DeepSeek、Qwen等)的本地化部署、調優及API接口開發;
基于ollama、vLLM等框架優化大模型推理效率,提升服務性能;
2.獨立完成Dify平臺的本地化部署,并開發企業級大模型應用;
使用RAGFlow、Llama-Factory等開源工具搭建行業解決方案;
3.參與大模型相關項目的全流程開發,包括需求分析、代碼實現及文檔撰寫;
持續跟蹤大模型技術發展,探索前沿技術落地場景。
任職要求:
1.計算機/人工智能/數學相關專業本科及以上學歷,1年以上相關經驗(優秀應屆生可放寬);
2.熟悉主流大模型架構及部署流程,能獨立完成本地環境配置與資源管理;
掌握ollama、vLLM等至少一種大模型推理框架的優化實踐;
3.具備Dify平臺本地部署經驗,能基于其開發企業級AI應用;
熟練使用RAGFlow、Llama-Factory等工具解決檢索增強生成、模型微調等問題;
熟練掌握Python,熟悉Linux開發環境及Git版本管理;
4.有強烈的技術熱情,良好的邏輯思維與問題解決能力;
5.加分項:有大模型實際項目開發經驗,或熟悉LangChain、向量數據庫等技術。