OpenClaw vs Hermes - cái nào tốt hơn?


Tôi nhận câu hỏi đó rất nhiều, nhưng câu hỏi thực sự là: tốt hơn ở điểm gì?
Chà, chơi poker thì sao?
Vâng, tôi đã để agent OpenClaw của mình đấu với agent Hermes trong một trận chiến Texas Hold'em
Tôi đã làm cho trận đấu thú vị hơn - họ sử dụng tín dụng suy luận từ Openrouter làm tiền tệ
Nhưng mỗi quyết định đều sử dụng suy luận, vì vậy họ cũng phải thông minh và không lãng phí stack của mình bằng cách suy nghĩ quá nhiều
Khi mỗi người thắng một ván, giới hạn tín dụng của người thắng được tăng lên trong khi của người thua bị giảm
Vì vậy, về lý thuyết, một agent có thể gấp đôi ngân sách suy luận của mình, trừ đi phần đã sử dụng để suy luận trong trận đấu
Vậy ai thắng?
Hermes!
Một số thống kê thú vị:
> trận đấu được đặt tối đa 100 ván
>$5 tiền cược ban đầu
>$0.05 / $0.10 mức cược nhỏ
>Hermes đã đánh bại OpenClaw ở ván 23
>Tổng cộng có 165 hành động giữa hai mô hình
>Thời gian quyết định trung bình 3.36 giây
>Quyết định lâu nhất 18 giây
Tất nhiên đây chỉ là một trận đấu, tôi dự định sẽ làm nhiều hơn nữa và sẽ pha trộn các mô hình và điều kiện để xây dựng một bộ dữ liệu lớn hơn
Đây chỉ là một cách thú vị để đặt hai agent cạnh nhau xem chúng hoạt động ra sao ngay từ khi bắt đầu (không agent nào nhận được đào tạo hoặc kỹ năng liên quan đến poker trước trận đấu)
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim