工作職責(zé)
負(fù)責(zé)基于大語(yǔ)言模型(LLM)的AIoT應(yīng)用開(kāi)發(fā),主導(dǎo)RAG(檢索增強(qiáng)生成)、Agent(智能體)、MCP(模型上下文協(xié)議)技術(shù)在桌面機(jī)器人、AI玩具、智能終端等場(chǎng)景的落地,實(shí)現(xiàn)自然語(yǔ)言交互、任務(wù)規(guī)劃及多模態(tài)數(shù)據(jù)處理;
設(shè)計(jì)并實(shí)現(xiàn)本地化大語(yǔ)言模型部署方案,結(jié)合國(guó)產(chǎn)算力平臺(tái)(如昇騰、寒武紀(jì))及邊緣計(jì)算芯片(如樂(lè)鑫ESP32-S3、瑞芯微RK3576/RK3588),完成模型量化(AWQ/GGUF)、顯存優(yōu)化(PagedAttention)及端側(cè)推理加速;
深度集成國(guó)內(nèi)云平臺(tái)(阿里云百煉、華為云昇騰AI服務(wù)、騰訊云NLP),實(shí)現(xiàn)模型服務(wù)的彈性擴(kuò)展與高可用性,滿足數(shù)據(jù)合規(guī)性與安全隔離要求;
開(kāi)發(fā)桌面機(jī)器人核心功能,包括舵機(jī)控制、傳感器融合、屏幕交互等,結(jié)合LLM實(shí)現(xiàn)語(yǔ)音問(wèn)答、環(huán)境感知、行為決策等智能化能力;
與前端團(tuán)隊(duì)協(xié)作,快速構(gòu)建技術(shù)驗(yàn)證Demo(如可視化對(duì)話系統(tǒng)、工具調(diào)用界面),支持產(chǎn)品原型設(shè)計(jì)與客戶演示。
任職要求
負(fù)責(zé)基于大語(yǔ)言模型(LLM)的AIoT應(yīng)用開(kāi)發(fā),主導(dǎo)RAG(檢索增強(qiáng)生成)、Agent(智能體)、MCP(模型上下文協(xié)議)技術(shù)在桌面機(jī)器人、AI玩具、智能終端等場(chǎng)景的落地,實(shí)現(xiàn)自然語(yǔ)言交互、任務(wù)規(guī)劃及多模態(tài)數(shù)據(jù)處理;
設(shè)計(jì)并實(shí)現(xiàn)本地化大語(yǔ)言模型部署方案,結(jié)合國(guó)產(chǎn)算力平臺(tái)(如昇騰、寒武紀(jì))及邊緣計(jì)算芯片(如樂(lè)鑫ESP32-S3、瑞芯微RK3576/RK3588),完成模型量化(AWQ/GGUF)、顯存優(yōu)化(PagedAttention)及端側(cè)推理加速;
深度集成國(guó)內(nèi)云平臺(tái)(阿里云百煉、華為云昇騰AI服務(wù)、騰訊云NLP),實(shí)現(xiàn)模型服務(wù)的彈性擴(kuò)展與高可用性,滿足數(shù)據(jù)合規(guī)性與安全隔離要求;
開(kāi)發(fā)桌面機(jī)器人核心功能,包括舵機(jī)控制、傳感器融合、屏幕交互等,結(jié)合LLM實(shí)現(xiàn)語(yǔ)音問(wèn)答、環(huán)境感知、行為決策等智能化能力;
與前端團(tuán)隊(duì)協(xié)作,快速構(gòu)建技術(shù)驗(yàn)證Demo(如可視化對(duì)話系統(tǒng)、工具調(diào)用界面),支持產(chǎn)品原型設(shè)計(jì)與客戶演示。