2026-04-10 12:04:04

Gemma 4在llama.cpp上終於穩了

4月2號Google發了Gemma 4，第一天就有llama.cpp支持但bug多。現在所有問題都修完了
E2B、E4B、26B MoE、31B Dense
31B在Arena AI排行第3，26B排第6
開源模型最強梯隊
用--chat-template-file加載interleaved模版
建議開啟--cache-ram 2048
上下文長度根據顯存來
去年本地最好的是Llama 3.1 70B量化版，勉強能用
現在Gemma 4 31B Q5在Mac Studio上流暢跑，接近GPT-4級別
不依賴API的AI應用開始有商業可行性。數據不出本機，成本為零，延遲極低
對於一人企業，本地模型是真正的基礎設施。競爭對手在付API費，你的邊際成本是電費
Gemma 4 + llama.cpp = 本地推理最優解，可以上生產了

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

1人按讚了這條動態

打賞
1
留言
轉發
分享

留言

請輸入留言內容

暫無留言

熱門話題
查看更多
#
Gate上線Pre-IPOs
21.2萬熱度
#
Gate現貨衍生品雙雙衝進全球前三
959.6萬熱度
#
原油小幅上漲
117.84萬熱度
#
加密市場回升
5.25萬熱度
#
Gate廣場四月發帖挑戰
126.92萬熱度

熱門 Gate Fun
查看更多

1
x
gooda
市值:$0.1持有人數:1
0.00%
2
linbei
林北
市值:$2312.23持有人數:2
0.14%
3
JKWI
Jokochan
市值:$2268.96持有人數:1
0.00%
4
Loveyou
Loveyou
市值:$0.1持有人數:0
0.00%
5
NMM
NoMoon
市值:$0.1持有人數:0
0.00%

Gemma 4在llama.cpp上終於穩了

熱門話題

Gate上線Pre-IPOs

Gate現貨衍生品雙雙衝進全球前三

原油小幅上漲

加密市場回升

Gate廣場四月發帖挑戰

熱門 Gate Fun

x

gooda

linbei

林北

JKWI

Jokochan

Loveyou

Loveyou

NMM

NoMoon

置頂