🔥 WCTC S8 全球交易賽正式開賽!
8,000,000 USDT 超級獎池解鎖開啟
🏆 團隊賽:上半場正式開啟,預報名階段 5,500+ 戰隊現已集結
交易量收益額雙重比拼,解鎖上半場 1,800,000 USDT 獎池
🏆 個人賽:現貨、合約、TradFi、ETF、閃兌、跟單齊上陣
全場交易量比拼,瓜分 2,000,000 USDT 獎池
🏆 王者 PK 賽:零門檻參與,實時匹配享受戰鬥快感
收益率即時 PK,瓜分 1,600,000 USDT 獎池
活動時間:2026 年 4 月 23 日 16:00:00 - 2026 年 5 月 20 日 15:59:59 UTC+8
⬇️ 立即參與:https://www.gate.com/competition/wctc-s8
#WCTCS8
我今天看到一個有趣的基準測試,對 AI 模型的能力提出了不少看法。PinchBench 在 OpenClaw 代理任務上測試了各種模型,結果非常不同。
Gemini 3 Flash 以 95.1% 的成功率位居第一。 但有趣的是,其他模型也非常接近。minimax-m2.1 達到了 93.6%,kimi-k2.5 則是 93.4%。Claude Sonnet 4.5 為 92.7%,而 GPT-4o 則停留在 85.2%。
這些模型之間的差距看起來並不大,但當涉及代理任務時,這些微小的差異也很重要。 如果你想了解 AI 模型的真正能力,這樣的基準測試會非常有幫助。