前 Tesla AI 總監、OpenAI 創始成員 Andrej Karpathy 於 4 月 9 日在 X 上發表長文,指出公眾對 AI 能力的認知正出現嚴重分裂。他認為,使用免費版 ChatGPT 的人與每天使用 Codex、Claude Code 等前沿 agent 工具的技術人員,實際上是在討論「完全不同的產品」,但雙方都認為自己看到的就是 AI 的全貌。
兩個世界,兩種 AI 認知
Karpathy 將目前的 AI 使用者分為兩個群體。
第一類人在去年某個時間點試用了 ChatGPT 免費版,便以此形成對 AI 的整體印象。他們看到的是模型的各種失誤 — 幻覺、搜尋結果離譜、語音模式連「該開車還是走路去洗車」這種簡單問題都搞砸。Karpathy 承認這些問題確實存在,但強調免費版與過時模型並不能代表 2026 年前沿 agent 模型的真實能力。
第二類人同時滿足兩個條件:付費使用最新的前沿 agent 模型(如 OpenAI Codex 或 Claude Code),並且在程式開發、數學、研究等技術領域專業使用。Karpathy 稱這群人正經歷高度的「AI 精神衝擊」(AI Psychosis),因為這些模型在技術領域的近期進步「只能用驚人來形容」— 你可以眼睜睜看著它們在一小時內解決原本需要數天甚至數週的程式架構問題。
為何進步集中在技術領域
Karpathy 解釋了 AI 能力提升為何在程式開發等技術領域特別顯著,而在搜尋、寫作、建議等一般用途上進步不那麼明顯。
原因有二:第一,技術領域提供了可驗證的獎勵函數(例如單元測試是否通過),這讓強化學習訓練得以有效運作;相比之下,寫作品質的優劣難以明確判定。第二,技術領域在 B2B 場景中更具商業價值,因此 AI 公司將最大比例的團隊資源投入在這些方向上。
兩個群體互相聽不懂對方在說什麼
Karpathy 總結道,這兩個群體正在「各說各話」。OpenAI 免費版語音模式搞砸日常問題,與 OpenAI 最高階付費版 Codex 花一小時重構整個程式碼庫或發現系統漏洞 — 這兩件事同時為真。
他在後續回覆中補充,有人向他提出一個觀點:OpenClaw 事件之所以引發如此大的社會關注,正是因為它讓大量非技術人員首次接觸到了最新的 agent 模型,而這些人此前只知道 AI 等於 ChatGPT 網頁版。
這篇文章 Karpathy:AI 能力認知出現嚴重斷層,免費版與前沿 Agent 是「完全不同的產品」 最早出現於 鏈新聞 ABMedia。