Meta AI 發布用於物理規劃的聯合嵌入預測世界模型 JEPA-WMs

ME News 消息,4 月 3 日(UTC+8),Meta AI Research 團隊發布了用於物理規劃的聯合嵌入預測世界模型 JEPA-WMs 及其相關研究。該研究探討了模型成功的關鍵因素,並提供了完整的 PyTorch 實作、資料集與預訓練模型。發佈的模型包括核心的 JEPA-WM 以及作為基線的 DINO-WM 與 V-JEPA-2-AC(fixed) 模型,涵蓋 DROID & RoboCasa、Metaworld、Push-T、PointMaze 和 Wall 等多個機器人操作與導航環境。模型採用了 DINOv3 ViT-L/16、DINOv2 ViT-S/14 以及 V-JEPA-2 ViT-G/16 等視覺編碼器,輸入影像解析度主要為 224×224 或 256×256。專案也提供了可選的 VM2M 解碼器頭用於視覺化與軌跡解碼,但強調該解碼器對於訓練世界模型或進行規劃評估並非必需。所有資源已在 GitHub、Hugging Face 與 arXiv 上公開。(來源:InFoQ)

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言