OpenClaw vs Hermes - lequel est le meilleur ?


Je reçois cette question souvent, mais la vraie question est : meilleur en quoi ?
Eh bien, que diriez-vous au poker ?
Oui, j'ai fait jouer mon agent OpenClaw contre mon agent Hermes dans une bataille de Texas Hold'em
J'ai rendu la setup intéressante - ils ont utilisé des crédits d'inférence d'Openrouter comme monnaie
Mais chaque décision utilisait de l'inférence, ils devaient donc aussi être intelligents et ne pas gaspiller leur pile en réfléchissant trop
À chaque victoire d'une main, la limite de crédit du gagnant était augmentée tandis que celle du perdant était diminuée
Donc, en théorie, un agent pourrait doubler son budget d'inférence, moins ce qui a été utilisé pour l'inférence lors du jeu
Alors, qui a gagné ?
Hermes !
Quelques statistiques intéressantes :
>le jeu était limité à un maximum de 100 mains
>$5 mise de départ
>$0.05 / $0.10 blindes
>Hermes a éliminé OpenClaw à la main 23
>165 actions totales entre les deux modèles
>temps de décision moyen 3,36 secondes
>décision la plus longue 18 secondes
Bien sûr, ce n'était qu'un seul match, je prévois d'en faire plus et de mélanger les modèles et conditions pour essayer de constituer un ensemble de données plus important
C'était juste une façon intéressante de mettre en compétition les deux agents pour voir comment ils se comportaient dès la sortie de la boîte (aucun agent n'a reçu de formation ou de compétences liées au poker avant le match)
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler