OpenClaw против Hermes - кто лучше?


Я получаю этот вопрос очень часто, но настоящий вопрос: лучше в чем?
Ну, как насчет покера?
Да, я заставил моего агента OpenClaw сыграть против моего агента Hermes в битве Техасского Холдама
Я сделал настройку интересной — они использовали кредиты для вывода из Openrouter в качестве валюты
Но каждое решение использовало вывод, поэтому им также нужно было быть умными и не тратить свой стек, думая слишком долго
Поскольку каждый выиграл руку, кредитный лимит победителя увеличивался, а у проигравшего уменьшался
Так что в теории один агент мог удвоить свой бюджет на вывод, минус то, что было использовано для вывода при игре
Итак, кто победил?
Hermes!
Несколько интересных статистик:
>игра была установлена на максимум 100 рук
>$5 ставка
>$0.05 / $0.10 блайнды
>Hermes выбил OpenClaw в руке 23
>всего 165 действий между обеими моделями
>среднее время решения 3.36 сек
>самое долгое решение 18 сек
Конечно, это был всего один матч, я планирую провести больше и буду менять модели и условия, чтобы построить более крупный набор данных
Это был просто интересный способ проверить обе модели друг против друга, чтобы увидеть, как они работают из коробки (ни одна из моделей не получала никакой подготовки или навыков, связанных с покером, перед матчем)
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить