崗位職責:
1、主導大模型在業務場景中的落地架構設計,包括:模型微調、推理優化、多模態融合、向量數據庫集成等,確保大模型高效賦能業務(如智能客服、數據分析、自動化決策等);
2、設計大模型與微服務、大數據平臺的協同架構,實現模型服務化部署、動態擴縮容及全鏈路監控,保障高可用性和低延遲;
3、參與項目核心技術選型,搭建智能化系統架構,結合微服務(Spring Cloud/Dubbo)、分布式計算(Flink/Spark)、物聯網(MQTT/Edgex)等技術,構建可擴展、高性能的技術中臺;
4、持續優化現有系統架構,解決高并發、大數據量處理、多端設備接入等場景下的性能瓶頸,確保架構的前瞻性和穩定性,
5、負責復雜技術難題攻關,如:大模型與業務數據的深度融合、實時數據流處理、分布式事務一致性等主導核心代碼編寫與技術方案評審。
6、跟蹤AI前沿技術(如 AIGC、大模型訓練框架等),探索新技術在業務中的應用場景,推動技術創新與落地。
崗位要求:
1、具備3年以上大模型相關項目經驗,熟悉主流大模型框架(如 Hugging Face、LLama、T
微調技術(LORA、QLORA)及推理優化(量5)、及推理優化(量化)、分布式推理)。
2、大模型/Al 基礎:熟悉 PyTorch/TensorFlow 等深度學習框架,了解 NLP 基礎理論(分詞、向量
化、意圖識別),具備模型評估與調優經驗。
3、分布式與微服務:精通 Spring Cloud、Dubbo.K8s/Docker 等微服務架構,熟悉分布式緩存(Redis)、消息中間件(Kafka/RocketMQ)、負載均衡(Nginx);
4、基礎技術:扎實的 Java 開發能力,熟悉MySQL等關系型數據庫及 MongoDBElasticsearch 等非結構化存儲,具備JVM調優、SQL優化經驗。
5、本科及以上學歷,計算機相關專業,8年以上軟件開發經驗,3年以上系統架構設計經驗,有大型分布式、高并發系統落地案例。