OpenClaw 対 Hermes - どちらが優れているか？
その質問はよく受けますが、本当の質問は：何に対して優れているのか？
そうですね、ポーカーはどうでしょう？
はい、私のOpenClawエージェントに私のHermesエージェントとテキサスホールデムのバトルをさせました
設定を面白くしました - 彼らはOpenrouterの推論クレジットを通貨として使用しました
しかし、各決定には推論が必要だったので、彼らも賢くなければならず、あまり考えすぎてスタックを無駄にしないようにしなければなりませんでした
各ハンドに勝つと、勝者のクレジット制限が増加し、敗者の制限が減少しました
したがって、理論的には、1つのエージェントが推論予算を倍にできる可能性があり、ゲームをプレイするために使用された分を差し引きます
では、誰が勝ったのでしょうか？
Hermesです！
いくつかの興味深い統計：
>ゲームは最大100ハンドに設定
>$5 ベット額
>$0.05 / $0.10のブラインド
>Hermesは23ハンドでOpenClawを破った
>両モデル間の合計アクション数は165
>平均決定時間は3.36秒
>最長決定時間は18秒
もちろん、これは一つの試合に過ぎません。もっと多くの試合を行う予定で、モデルや条件を変えて、より大きなデータセットを作成しようと考えています
これは、両エージェントを

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-27 21:48

製品を作ることはこれまでになく簡単になったが、何を作るべきかを知ることはこれまでになく難しくなった

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-25 22:28

週末は構築のためにある…ただし今日はほとんど散らかったコードの掃除だった
だから皆さんの時間を節約するために作ったスキルを公開します - それは一つのコマンド /tech-debt-skill
そして、対処すべきすべての項目が記載された非常に詳細なレビューファイルが返ってきます
バグや問題だけでなく、動作しているが整理や改善が必要な点も含まれています
私は半日を Hermes Atlas の掃除に費やし、その後それを整理してこのスキルにまとめ、別のプロジェクトで実行したところ、多くの問題を見つけました
始める前は、Claude Code にこれ用の組み込みスキルがあると思ったのですが、そうではなく、技術的負債を全体的に見るものは確かになかった
だから、AIがすべてのコーディングを行い、プロジェクト内で段階的に構築しているなら、確実に多くの技術的負債を蓄積していることになります - 時々このスキルを使って掃除し、後で感謝してください

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-25 15:51

妻：「誕生日に何が欲しい？」
私：

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-24 14:53

これが私が朝一番にクロードを起動する理由です、通常は午前6時頃
今は窓のリセットまで約20分待つだけです、子供を学校に送ったりジムに行ったりしていて席を離れていたからです
ジムの後に始めたら、5時間のセッションでずっと早く制限に達してしまいます

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

04-23 11:06

多くの人が私たちは「計算制約を受けている」と言っているのを聞きます。
それは最近モデルを使うときに感じることです。
しかし、問題は実際にはGPUを注文してからトークンを生成するまでの物理的な作業にあります。
データセンターの遅延とキャンセル：
- Stargateを覚えていますか？ 2025年1月に10GWが発表され、14ヶ月後に約200MWが稼働し、600MWのアビリーン拡張は報告によるとキャンセルされています。
- 2026年の米国AIデータセンター容量約16GWのうち、建設中は約5GWだけです。
- 2026年の米国データセンター建設の半分は遅延またはキャンセルと予測されており、主に電力不足によるものです。
部品不足：
- トランスフォーマーのリードタイムは現在5年以上で、2020年前の24〜30ヶ月から増加しています。
- シーメンス、GE、Vertiv、Eatonはすべて記録的なバックログを報告しています。
労働力不足：
- マイクロソフトは、電気技師がデータセンター拡張の最大の障壁だと報告しています。
- ノーザンバージニアの電気技師は2018年から倍増し、14,700人に達していますが、それでも十分ではありません。
- 見習い期間は4〜5年かかります。
2026年の資本支出がどのように展開されるのか疑問に思わざる

STG5.55%

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-22 13:12

ベビーシッターモード - 何をすればいい？
最近、モデル (Claude、GPT、GLM) すべてが完了までに止まることが以前よりも頻繁に見られる
彼らは一時停止して、私が確認するのを待っているが、それは必要ないはず
だから私は「続けて」と言うために、より頻繁にベビーシットしなければならない
これは需要の急増に伴う調整のための意図的な動作だと理解しているが、面倒だ
他の人もこれを頻繁に見ているか、そしてベビーシットモードを避けるためにどんなツールやプロンプトを使っているか教えてほしい

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-20 19:12

Opus 4.7は今日、ちょっと冴えていません
「私のミス - 計画を提示して承認を求めたが、実際にはファイルを書かなかった」
「ごめん - 私のミスです、何もする必要はありません」【それは私に意味のわからないことのリストを渡した後で】
私の推測：制約付き計算

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-18 19:57

Hermes Atlas v2がリリースされました！
> 完全なサイトのリデザイン
> ネイティブページ付きのリポジトリが90以上レビュー済み
> 人気バンドルのキュレーションリスト
> さらにコンテンツが追加される新しいレポートページ
まだ調整中なので、何か見つけたら問題を提出するか、下に返信してください

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-18 17:41

アントロピックは、計算能力の拡大速度よりも速く製品を拡大しているのはかなり明らかです
私はこれを良いことだと考えています - これにより、1つの企業がAGIへのレースであまりにも大きく差をつけるのが難しくなります

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-16 21:23

これまでにOpus 4.7にあまり期待していない人はいますか？
結論を出す前にもう少しやることを増やす必要がありますが、現時点での予測では大きな進展はありません。
もしかすると、Mythosについて聞いた後で期待しすぎているだけかもしれません。

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

KevinSimback

04-16 11:20

私はHermesエージェントの別々のインスタンスをチャットに入れました、マジで面白い
>1つのエージェントはビルダー、もう1つはストラテジスト
>それぞれ別のモデルを使用
>共有コンテキストをいくつか与えた
>bot2botを有効にし、各ボットをもう一方のTG許可リストに追加
>私たち3人をグループチャットに入れた
>最初は、互いのメッセージが見えるか確認する簡単な投稿から始めた
>約10回のハンドシェイクの後、彼らはただ建設を始めた
時には、これらのことをFAFOして何が起こるか見てみる必要がある、これがおそらく無限ループになると思うので、介入が必要かもしれない

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-15 18:07

AIに関する私が今とても興味を持っている3つのトピック：
1. ローカルモデルによるコスト最適化されたモデル利用
なぜ -> これからもほぼ無制限に使える200ドル/月の最良モデルを手に入れることは難しくなると思う
壁に書かれている、巨大研究所はもう長く補助金を出し続けられない
だから、Claude Maxを楽しむのは今のうちだけだけど、すぐにでもすべての企業やパワーユーザーは、タスクに応じて異なるモデル間を効率的にルーティングし、クラウドとローカルの間を行き来する方法を学ぶ必要があり、ローカルが鍵になる
2. エージェンティック製品の堀（moats）の特定
なぜ -> エージェントは世界に大きな影響を与えるが、その価値の蓄積は明らかではない
これについて多くの調査を行っており、エージェント分野において堀を作る5つの要素を特定した - 近日レポート公開予定
ヒント：堀はハーネス（ harness）そのものではなく、ハーネスが収集するもの
3. コンテキストエンジニアリングによる競争優位
なぜ -> 知性が豊富な世界では、コンテキストが他より優れた結果を生み出す
どの分野でも重要なのはコンテキストであり、独自のデータをコンテキストとして使うことが新しい知的財産（IP）になる

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-14 18:17

A LLM-wikiは、まとめられた知識ベースです - これは素晴らしく、目的に役立ちます
しかし、それは「第二の脳」ではありません
A LLM-wikiは、あなたが調査し、もしかしたら読んだことを捉えます
しかし、それはあなたが読んだことについてどう考えているかを捉えません、そしてその違いが全てのポイントです

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-11 18:53

最近、Claudeが何かを完了した後に「今日はもう終わりだ」と言うのを誰か気づきましたか？
それは、Maxプランのユーザーにあまり使わせないようにする微妙な方法なのかもしれません — 「ユーザーに何かを成し遂げたと感じさせて、使うのをやめさせる」

原文表示

報酬
いいね
コメント
リポスト
共有

KevinSimback

04-10 20:36

人々は競争的です
私たちは競争するのが好きで、他人の競争を見るのも好きで、他人の競争の結果に賭けるのも好きです。これは競争の一形態です
AIエージェントは、新しいジャンルの競争のためのデザインキャンバスを開きます
私のエージェントが競い合うのを楽しみにしています

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

KevinSimback

04-10 13:11

🚀 無料でOpenClawやHermesにプラグインできるモデルが欲しいですか？
こちらは無料で利用できるモデルAPIのリソース9つです
ローカル設定不要、クレジットカード不要、OpenAI互換のエンドポイントを持つ純粋なクラウドAPIです
まだ無料のOpusクオリティは(手に入らないかもしれません)が、これらすべてには現在本物の無料ティアがあります(レート制限が適用される場合もあります)エージェントを始めるためにお金を使いたくない場合でも十分に始められます
1️⃣ OpenRouter 無料モデル
(Gemma 4 31B/26B、NVIDIA Nemotron 3 Super 120B MoE、MiniMax M2.5、Qwen3バリアント、Llama 4/3.3、gpt-oss-120B、Arcee Trinityなど) • 約29の完全無料の$0/トークンモデル • 多彩な種類とトップクラスのオープンモデル評価(特にコーディングとエージェント) • 自動的にモデルをローテーションするのに最適
👉 サインアップ：
2️⃣ Google Gemini API
(Gemini 2.5 Pro / Flashシリーズ) • 最も強力な無料フロンティアモデル • 優れたマルチモーダル、1M+のコンテキスト、ネイティブツール呼び出し＆エージェント性能 • 非常に寛大な無料制限(

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

人気の話題
もっと見る
#
WCTCTradingKingPK
379.45K 人気度
#
#FedHoldsRateButDividesDeepen
8.34K 人気度
#
IsraelStrikesIranBTCPlunges
36.34K 人気度
#
#DailyPolymarketHotspot
708.81K 人気度
#
BitcoinSpotVolumeNewLow
162.65M 人気度

ピン

サイトマップ

KevinSimback

人気の話題

WCTCTradingKingPK

#FedHoldsRateButDividesDeepen

IsraelStrikesIranBTCPlunges

#DailyPolymarketHotspot

BitcoinSpotVolumeNewLow

ピン