崗位職責:
1、模型服務化與部署:主導大模型(LLM)的服務化開發,設計高性能、可擴展的模型API服務,支持高并發、低延遲的在線推理需求。
優化模型部署方案(如容器化/Docker、Kubernetes、模型量化剪枝),解決顯存管理、動態負載均衡等工程問題。
構建模型監控體系,跟蹤服務性能(如吞吐量、錯誤率)及業務指標(如AI輸出準確率)。
2、跨系統集成指導:主導AI能力與現有軟件系統(如ERP、CRM、OA)、數據平臺(數據湖/數倉)及業務流程的集成,設計標準化接口規范。
針對復雜業務場景(如智能客服、自動化報告生成),設計端到端AI解決方案,協調前后端、數據團隊完成聯調。
制定數據流轉方案,確保輸入輸出數據與業務系統兼容(如結構化數據轉換、非結構化文本處理)。
基本要求:
1、3年以上AI工程化經驗,至少主導過1個以上AI系統集成項目(如將大模型嵌入企業工作流)。
2、精通Python。
3、本科及以上學歷。
加分項:
1、具備跨團隊協作經驗,能撰寫技術方案書并面向非技術角色宣講。
2、有LLM應用中間件開發經驗(如流量控制、緩存機制、審計日志)。