PANews informó el 27 de febrero que, según Cointelegraph, el laboratorio de IA de código abierto Sentient anunció el lanzamiento de Arena, un entorno de pruebas de nivel producción para evaluar el rendimiento de agentes de IA en flujos de trabajo a nivel empresarial. Las divisiones de activos digitales de Pantera Capital y Franklin Templeton se han unido a la primera cohorte de pruebas de Arena.
Sentient afirmó que Arena no es una prueba de modelo estático, sino que prueba al agente de IA en una tarea estandarizada simulando condiciones empresariales con documentos extensos, información incompleta y fuentes contradictorias. La plataforma rastrea categorías de fallo como alucinaciones, pruebas faltantes, errores de citación y vulnerabilidades de razonamiento para ayudar a los desarrolladores a diagnosticar problemas. Arena planea publicar métricas comparativas de rendimiento a través de clasificaciones públicas y publicar informes de prueba que resuman patrones y soluciones comunes de fallos.
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
Myriad usará USD1 en BNB Chain como activo de liquidación exclusivo
El mercado de predicciones Myriad está en transición hacia la stablecoin USD1 de World Liberty Financial como su activo de liquidación exclusivo. Como parte de la transición, Myriad, propiedad de la empresa matriz de _Decrypt_ Dastan, está migrando su catálogo completo de mercados de predicciones a BNB Chain.
> Bienvenido a la Temporada 3 de MYRIAD.
>
> Nuestro b
DecryptHace2m
El protocolo DeFi del ecosistema Solana Drift lanzará la función de recarga multichain el 12 de marzo
Gate News Noticias, el 11 de marzo, el protocolo DeFi del ecosistema Solana Drift anunció que lanzará la función de recarga multichain el 12 de marzo, permitiendo a los usuarios transferir fondos desde cualquier plataforma de intercambio principal y comenzar a operar.
GateNewshace1h
VanEck: Las empresas mineras de Bitcoin se transforman en infraestructura de IA, existe potencial de descuento en su valoración
El director de investigación de VanEck, Matthew Sigel, señaló que las acciones de minería de Bitcoin son atractivas para los inversores, ya que las empresas mineras están orientándose al mercado de IA para aumentar su valor. Core Scientific planea vender activos de Bitcoin para expandir su negocio de IA, y Riot Platforms espera lograr una transformación estratégica en 2025. En los últimos 12 meses, las acciones de Core y Riot han subido más del 90%, mientras que MARA ha caído un 35% debido al aumento de costos. El ETF NODE ha subido más del 30% desde su lanzamiento.
GateNewshace1h
Guía de emboscada temprana de Ferra: cadena Sui sexy, reparto en línea
Ferra es un DEX integral en la cadena Sui, que utiliza una capa de liquidez dinámica y múltiples motores AMM, y ha completado una financiación de 2 millones de dólares. Los usuarios pueden acumular puntos a través de minería de liquidez y comercio, participando en airdrops. El proyecto es simple y fácil de operar, con bajos costos de participación en las etapas iniciales y un buen potencial de crecimiento.
PANewshace1h
Elon Musk: Macrohard es un proyecto conjunto de xAI y Tesla que puede simular el funcionamiento completo de la empresa
Musk reveló que xAI, en colaboración con Tesla, está desarrollando el proyecto Macrohard o Digital Optimus, que combina las tecnologías Grok y AI, y puede procesar operaciones informáticas en tiempo real. Este sistema simula el funcionamiento completo de la empresa y ha sido apodado "Gigahard". Su objetivo es crear un sistema de IA inteligente en tiempo real, único y de bajo costo.
GateNewshace2h