Meta AI lanza JEPA-WMs, un modelo de mundo predictivo de incrustación conjunta para planificación física

Noticias de ME, el 3 de abril (UTC+8), el equipo de Meta AI Research publicó los modelos de mundo JEPA-WMs de predicción de incrustaciones conjuntas para planificación física y sus investigaciones relacionadas. Este estudio analiza los factores clave para el éxito del modelo y proporciona una implementación completa en PyTorch, un conjunto de datos y modelos preentrenados. Los modelos publicados incluyen el JEPA-WM central y, como base comparativa, los modelos DINO-WM y V-JEPA-2-AC(fixed), abarcando múltiples entornos de operación y navegación robótica, como DROID & RoboCasa, Metaworld, Push-T, PointMaze y Wall. El modelo utiliza codificadores visuales como DINOv3 ViT-L/16, DINOv2 ViT-S/14 y V-JEPA-2 ViT-G/16, y la resolución de entrada de las imágenes es principalmente de 224×224 o 256×256. El proyecto también ofrece un encabezado decodificador opcional de VM2M para visualización y decodificación de trayectorias, pero destaca que dicho decodificador no es necesario para entrenar un modelo de mundo ni para realizar evaluaciones de planificación. Todos los recursos ya están disponibles públicamente en GitHub, Hugging Face y arXiv. (Fuente: InFoQ)

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado