Gate 廣場“新星計劃”正式上線!
開啟加密創作之旅,瓜分月度 $10,000 獎勵!
參與資格:從未在 Gate 廣場發帖,或連續 7 天未發帖的創作者
立即報名:https://www.gate.com/questionnaire/7396
您將獲得:
💰 1,000 USDT 月度創作獎池 + 首帖 $50 倉位體驗券
🔥 半月度「爆款王」:Gate 50U 精美周邊
⭐ 月度前 10「新星英雄榜」+ 粉絲達標榜單 + 精選帖曝光扶持
加入 Gate 廣場,贏獎勵 ,拿流量,建立個人影響力!
詳情:https://www.gate.com/announcements/article/49672
谷歌今天發布了Gemini 3.1 Pro,剛看到測試評分,感覺這是衝著屠榜來的(模型軍備競賽繼續,利好半導體!)😂
官方定位很明確:專為複雜任務設計,比如深度研究、工程難題、長鏈推理和agentic工作流。
核心亮點:1M token上下文窗口(保持不變)
多模態支持(文本+圖像+視頻+音頻+代碼)
輸出最高64k tokens
性能對比當前主流模型(Claude Opus 4.6、GPT-5.2/5.3等):
ARC-AGI-2(最難的抽象推理基準):
Gemini 3.1 Pro 77.1%,領先Claude 4.6(68.8%)約8-9個百分點,
領先GPT-5系列20-30+個百分點。這是最大進步,代表核心推理質的飛躍。
GPQA Diamond(PhD級科學推理):94.3%,小幅領先Claude 4.6(91.3%)和GPT-5.2(92.4%),差距2-3個百分點,基準已接近飽和。
SWE-Bench Verified(真實軟體工程任務):80.6%,領先Claude 4.6(約76-77%)3-5個百分點,領先GPT明顯(5-15%)。
其他:Terminal-Bench、APEX-Agents等長時agent任務上也拿下多個第一;LMArena/Artificial Analysis指數目前排第1,成本效率高。
更重要的是,成本優勢明顯:
API定價(每1M tokens,基於Vertex AI / Gemini API最新數據,≤200k上下文標準價):
Gemini 3.1 Pro:輸入 $2.00,輸出 $12.00(>200k上下文翻倍到$4/$18)
Claude Opus 4.6:輸入 $5.00,輸出 $25.00
GPT-5.2 / 5.x:輸入通常$10–15+,輸出$30–75+(高端tier更高,具體視版本)
優勢幅度:輸入:Gemini比Claude便宜約60%(2 vs 5),比GPT系列便宜70–80%以上。
輸出:Gemini比Claude便宜約52%(12 vs 25),比GPT便宜60–80%以上。