【崗位職責】:
1、負責強化學習算法的研究、開發和應用,解決實際問題并提升業務效果;
2、設計和實現強化學習模型,包括但不限于價值迭代、策略梯度、模型預測控制等算法;
3、對現有強化學習算法進行優化和改進,提高算法的穩定性和收斂速度;
4、與數據工程師和產品團隊合作,將強化學習算法集成到產品和服務中;
5、跟蹤強化學習領域的最新研究進展,不斷探索和創新,推動公司技術發展;
6、參與撰寫技術文檔,為團隊提供算法知識和技能培訓;
7、參與項目的需求分析、方案設計和技術評審。
【任職要求】:
1、計算機科學、人工智能、數學或相關專業碩士及以上學歷,有3年以上強化學習算法開發經驗;
2、熟悉強化學習的基本理論和算法,如Q-Learning、SARSA、Deep Q-Network (DQN)、Policy Gradient等;
3、具備扎實的數學基礎,包括概率論、統計學、線性代數等;
4、熟練掌握至少一種編程語言,如Python,并熟悉TensorFlow、PyTorch等深度學習框架;
5、具備良好的科研能力,有在相關領域發表過論文者優先;
6、具備良好的邏輯思維能力和問題解決能力,能夠獨立分析和解決復雜問題;
7、有實際應用強化學習算法解決復雜問題的經驗,如游戲、機器人控制、自動駕駛等;
8、具備良好的團隊合作精神和溝通能力,能夠與不同部門有效協作;
9、對技術創新有熱情,愿意不斷學習新知識,適應快速變化的技術環境。
【公司亮點】:
國企背書、發展穩定、五險一金、月度補貼、企業年金、法定假期、項目獎金、年終獎金