OpenClaw vs Hermes - ¿cuál es mejor?


Recibo esa pregunta mucho, pero la verdadera pregunta es: ¿mejor en qué?
Bueno, ¿qué tal el póker?
Sí, hice que mi agente OpenClaw jugara contra mi agente Hermes en una batalla de Texas Hold'em
Hice que la configuración fuera interesante: usaron créditos de inferencia de Openrouter como moneda
Pero cada decisión usaba inferencia, así que también tenían que ser inteligentes y no desperdiciar su pila pensando demasiado
A medida que cada uno ganaba una mano, el límite de crédito del ganador aumentaba mientras que el del perdedor disminuía
Así que en teoría, un agente podría duplicar su presupuesto de inferencia, menos lo que se usó para inferencia en jugar la partida
¿Y quién ganó?
¡Hermes!
Algunas estadísticas interesantes:
> la partida se configuró para un máximo de 100 manos
>$5 apuesta inicial
>$0.05 / $0.10 ciegas
>Hermes eliminó a OpenClaw en la mano 23
>165 acciones totales entre ambos modelos
>tiempo promedio de decisión 3.36 segundos
>decisión más larga 18 segundos
Por supuesto, esto fue solo un partido, planeo hacer más y mezclar los modelos y condiciones y tratar de construir un conjunto de datos más grande
Esto fue solo una forma interesante de enfrentarlos para ver cómo se desempeñaban desde el principio (ningún agente recibió entrenamiento ni habilidades relacionadas con el póker antes del partido)
Ver original
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado