🔥阿里 PAI 開源 AgenticQwen:雙數據飛輪訓練,8B 性能逼近 235B


阿里 PAI 團隊發布並開源 AgenticQwen 系列模型(8B、30B-A3B),專為工業級工具調用設計。通過「雙數據飛輪」強化學習框架,模型在 TAU-2 和 BFCL-V4 基準中,8B 版本平均得分 47.4,接近 Qwen3-235B 的 52.0,30B-A3B 版本得分 50.2。該模型已在內部生產系統部署,但受限於 40K 上下文長度,深層搜索任務仍有局限。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言