✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
Anthropic 聯合 12 家巨頭發起「玻璃翼」計劃,用未發布的最強模型 Mythos 修補全球軟體漏洞
作者: Anthropic
編譯: 深潮 TechFlow
深潮導讀: Anthropic 發布了一個尚未公開的前沿模型 Claude Mythos Preview,其程式碼審計能力已超過絕大多數人類安全專家,能自主發現存在數十年的零日漏洞。
基於這一能力,Anthropic 聯合 AWS、蘋果、谷歌、微軟、英偉達等 12 家科技巨頭發起 Project Glasswing 計畫,投入 1 億美元信用額度,目標是在攻擊者獲得同等能力之前,先把全球關鍵軟體的漏洞堵上。
引言
今天我們宣布 Project Glasswing(玻璃翼計畫),一項匯集亞馬遜雲科技(AWS)、Anthropic、蘋果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金會、微軟、英偉達和 Palo Alto Networks 的新倡議,目標是保護全球最關鍵的軟體安全。
我們發起 Project Glasswing,是因為 Anthropic 訓練的一個新前沿模型展現出了我們認為可能重塑網路安全格局的能力。Claude Mythos Preview 是一個通用的、尚未發布的前沿模型,它揭示了一個殘酷事實:AI 模型的編碼能力已經達到了這樣的水準——在發現和利用軟體漏洞方面,它們可以超越除最頂尖專家之外的所有人。
Mythos Preview 已經發現了數千個高危漏洞,涵蓋每一個主流作業系統與每一個主流瀏覽器。按照 AI 的進步速度,這種能力在不遠的將來就會擴散,可能落入不負責任的使用者手中。對經濟、公眾安全和國家安全的衝擊可能非常嚴重。Project Glasswing 是一次迫切的嘗試,要把這些能力優先用於防禦。
作為 Project Glasswing 的一部分,上述合作夥伴將在其防禦性安全工作中使用 Mythos Preview;Anthropic 會分享所學經驗,讓整個產業受益。我們也向另外 40 多個建構或維護關鍵軟體基礎設施的組織開放了存取權限,讓它們可以掃描和加固自有系統及開源系統。Anthropic 為此承諾投入最高 1 億美元的 Mythos Preview 使用額度,以及 400 萬美元直接捐贈給開源安全組織。
Project Glasswing 只是一個起點。沒有哪家機構能獨自解決網路安全問題:前沿 AI 開發者、其他軟體公司、安全研究人員、開源維護者以及全球各國政府都有不可替代的角色。防禦全球網路基礎設施可能需要數年時間;而前沿 AI 能力在未來幾個月內就可能大幅躍進。網路防禦者要想佔據先機,必須現在就行動。
AI 時代的網路安全
我們每天依賴的軟體——運行銀行系統、儲存醫療記錄、連接物流網路、維持電網運轉——一直都有 bug。大多數無關緊要,但有些是嚴重的安全缺陷,一旦被發現,攻擊者就能劫持系統、癱瘓營運或竊取資料。
網路攻擊對企業網路、醫療系統、能源基礎設施、交通樞紐以及各國政府機構的破壞性後果已經有目共睹。在全球層面,來自中國、伊朗、北韓和俄羅斯的國家級攻擊已經威脅到支撐民用生活和軍事準備的基礎設施。即使是針對單一醫院或學校的小規模攻擊,也能造成巨大的經濟損失、暴露敏感資料,甚至危及生命。全球網路犯罪的年度經濟損失難以精確估算,但可能在 5000 億美元左右。
過去,許多軟體缺陷多年不被發現,因為找出並利用它們需要極少數安全專家才具備的專業知識。但隨著最新前沿 AI 模型的出現,發現和利用軟體漏洞所需的成本、精力和專業門檻都大幅降低了。過去一年,AI 模型在程式碼閱讀和推理方面越來越強,特別是在發現漏洞和構造利用方式方面表現驚人。Claude Mythos Preview 在這些網路安全技能上實現了跨越式提升——它發現的一些漏洞在人類審查了數十年、經歷了數百萬次自動化安全測試後依然存活,而它開發的利用程式碼也越來越精巧。
在首屆 DARPA 網路大挑戰賽十年之後,前沿 AI 模型正在接近甚至追平最頂尖人類的漏洞發現和利用能力。如果沒有必要的安全措施,這些強大的網路能力可能會被用來利用全球最重要軟體中現存的大量缺陷。網路攻擊會變得更頻繁、更具破壞力,也會讓美國及其盟友的對手獲得力量。這是民主國家必須重視的安全優先順序。
好消息是:讓 AI 模型在錯誤的手中變得危險的那些能力,同樣使它們在發現和修復重要軟體缺陷方面極具價值——也能幫助生產出更少安全 bug 的新軟體。Project Glasswing 是讓防禦者在即將到來的 AI 驅動網路安全時代建立持久優勢的重要一步。
Claude Mythos Preview 發現漏洞和利用方式的能力
過去幾週,我們使用 Claude Mythos Preview 在每一個主流作業系統、每一個主流瀏覽器以及一系列其他重要軟體中,發現了數千個零日漏洞(也就是此前軟體開發者完全不知道的缺陷),其中許多是高危級別。
在 Frontier Red Team 部落格上,我們揭露了其中一部分已被修復的漏洞的技術細節,以及 Mythos Preview 找到的利用方式。幾乎所有這些漏洞的發現(以及許多相關利用方式的開發),都是模型完全自主完成的,沒有任何人類引導。以下是三個例子:
Mythos Preview 在 OpenBSD 中發現了一個存在 27 年的漏洞。OpenBSD 以極高的安全加固水準聞名,被廣泛用於防火牆和其他關鍵基礎設施。該漏洞允許攻擊者僅透過連接目標機器就能遠端使其崩潰。
它也在 FFmpeg 中發現了一個 16 年的漏洞。FFmpeg 被無數軟體用於視訊編解碼。問題出在一行程式碼上,而自動化測試工具已命中這行程式碼 500 萬次,卻從未發現問題。
該模型自主發現並串聯了 Linux 核心中的數個漏洞(Linux 核心運行著全球大部分伺服器),實現了從一般使用者權限到完全控制機器的提權攻擊。
上述漏洞我們已全部回報給相關軟體維護者,且均已修復。對於其他許多漏洞,我們今天提供了細節的加密雜湊(見 Red Team 部落格),待修復完成後再公開具體資訊。
CyberGym 等評估基準也驗證了 Mythos Preview 與我們次強模型 Claude Opus 4.6 之間的顯著差距:
網路安全漏洞複現 - CyberGym
除了我們自己的工作,許多合作夥伴也已使用 Claude Mythos Preview 數週。以下是他們的回饋:
「AI 能力已跨過一個門檻,從根本上改變了保護關鍵基礎設施免受網路威脅侵害所需的迫切程度,而且不可逆轉。我們用這些模型的基礎工作表明,可以以前所未有的速度和規模辨識和修復硬體與軟體中的安全漏洞。這是一個深刻的轉變,也是一個清晰的訊號:舊的系統加固方式已經不夠了。技術供應商必須立即主動採用新方法,客戶也需要做好部署準備。這就是思科加入 Project Glasswing 的原因——這項工作太重要、太迫切,不能單打獨鬥。」
—— Anthony Grieco,思科高級副總裁兼首席安全與信任官
「在 AWS,我們在威脅出現之前就建構防禦,從客製化晶片到整個技術堆疊。安全不是某個階段的事,它是持續的,嵌入我們所做的一切。我們的團隊每天分析超過 400 萬億次網路流量以偵測威脅,AI 是我們大規模防禦能力的核心。我們一直在自己的安全營運中測試 Claude Mythos Preview,將其應用於關鍵程式碼庫,它已經在幫助我們加固程式碼。我們正在為與 Anthropic 的合作注入深厚的安全專業知識,並協助強化 Claude Mythos Preview,讓更多組織能以最高安全標準推進工作。」
—— Amy Herzog,亞馬遜雲科技副總裁兼首席資訊安全官
「當網路安全不再受限於純人力能力時,負責任地使用 AI 大規模提升安全性並降低風險的機會是史無前例的。加入 Project Glasswing 並取得 Claude Mythos Preview 的存取權,使我們能夠更早識別和緩解風險,增強我們的安全與開發解決方案,從而更好地保護客戶與微軟。在我們的開源安全基準 CTI-REALM 測試時,Claude Mythos Preview 相較於先前的模型展現出實質的提升。我們期待與 Anthropic 及更廣泛的產業合作,為所有人改善安全成果。」
—— Igor Tsyganskiy,微軟網路安全與微軟研究執行副總裁
「漏洞從被發現到被攻擊者利用的窗口期已經崩塌——過去需要幾個月的事,現在用 AI 幾分鐘就能完成。Claude Mythos Preview 展示了防禦者大規模行動的可能性,而對手將不可避免地尋求利用同樣的能力。這不是放慢腳步的理由,而是一起加速前進的理由。要部署 AI,就必須有安全保障。這就是 CrowdStrike 從第一天就參與其中的原因。」
—— Elia Zaitsev,CrowdStrike 首席技術官
「過去,安全專業知識是只有擁有龐大安全團隊的組織才能享有的奢侈品。開源軟體維護者——他們的軟體支撐著全球大部分關鍵基礎設施——歷來只能自己想辦法解決安全問題。開源軟體構成了現代系統中絕大部分程式碼,包括 AI 智能體用來編寫新軟體的系統本身。透過讓這些關鍵開源程式碼庫的維護者取得新一代 AI 模型的存取權——能夠大規模主動辨識和修復漏洞——Project Glasswing 提供了一條切實的路徑來改變這一局面。這是 AI 增強安全如何從大團隊的專屬工具變成每個維護者的可靠助手的方式。」
—— Jim Zemlin,Linux 基金會 CEO
「促進金融體系的網路安全與韌性是摩根大通使命的核心,我們相信當領先機構就共同挑戰攜手合作時,產業是最強大的。Project Glasswing 提供了一個獨特的早期機會,讓我們可以依照自己的標準評估下一代 AI 工具在關鍵基礎設施防禦性網路安全中的能力,同時與受尊重的技術領袖並肩作戰。我們將採取嚴謹、獨立的方式來確定如何推進以及如何提供協助。Anthropic 的倡議體現了這一時刻所需要的前瞻性、協作性方法。」
—— Pat Opet,摩根大通首席資訊安全官
「谷歌很高興看到這一跨產業網路安全倡議的形成,並透過 Vertex AI 向參與者提供 Mythos Preview。產業在新興安全問題上的協作一直至關重要,無論是後量子密碼學、負責任的零日漏洞揭露、開源軟體安全,還是防禦基於 AI 的攻擊。我們一直相信 AI 在網路防禦中既帶來新挑戰也帶來新機遇,這就是我們建構 Big Sleep 和 CodeMender 等 AI 驅動工具來辨識和修復關鍵軟體缺陷的原因。我們將持續投資於領先的網路安全平台和以保護使用者、客戶、生態系及國家安全為核心的文化。」
—— Heather Adkins,谷歌安全工程副總裁
「過去幾週,我們一直在使用 Claude Mythos Preview 模型,用它來辨識前一代模型完全遺漏的複雜漏洞。這不僅改變了發現隱藏漏洞的遊戲規則,也意味著攻擊者很快就能比以往更快地發現更多零日漏洞並開發利用程式碼。很明顯,這些模型需要交到開源專案所有者與所有防禦者手中,在攻擊者取得存取權之前辨識並修復漏洞。也許更重要的是:每個人都需要為 AI 輔助的攻擊者做好準備。攻擊會更多、更快、更複雜。現在是全面升級網路安全體系的時候了。我們讚賞 Anthropic 與產業合作,確保這些強大能力優先服務於防禦。」
—— Lee Klarich,Palo Alto Networks 首席產品與技術官
Claude Mythos Preview 強大的網路安全能力,源於其卓越的智能體編碼和推理能力。以下評估結果顯示,該模型在多項軟體編碼任務上取得了所有已知模型中的最高分。
智能體編碼
推理
智能體搜尋與電腦使用
註解:
SWE-bench Verified、Pro 和 Multilingual:記憶化篩查標記了部分題目。排除可能存在記憶化的題目後,Mythos Preview 相對 Opus 4.6 的優勢幅度不變。
SWE-bench Multimodal:使用內部實作,分數與公開排行榜不可直接比較。
Terminal-Bench 2.0:使用 Terminus-2 框架,自適應思考模式下最大努力,每個任務總預算 100 萬 token,1 倍保證 / 3 倍上限資源配置,每任務 5 次嘗試取平均。將逾時限制提高到 4 小時並使用 Terminal-Bench 2.1 更新後,Mythos Preview 得分 92.1%。
BrowseComp:Claude Mythos Preview 得分高於 Opus 4.6,同時 token 消耗量僅為後者的 1/4.9。
Humanity’s Last Exam:Mythos 在低努力模式下仍表現良好,可能存在一定程度的記憶化。
更多關於該模型能力、安全屬性和基本特徵的信息,請參閱 Claude Mythos Preview 系統卡。
我們不計畫將 Claude Mythos Preview 面向公眾開放,但最終目標是讓使用者能夠安全地大規模部署 Mythos 等級的模型——不僅用於網路安全,也用於這類高能力模型將帶來的眾多其他價值。為此,我們需要在開發網路安全(及其他)安全防護措施方面取得進展,能夠偵測和阻止模型最危險的輸出。我們計畫在即將推出的 Claude Opus 模型中發布新的安全防護措施,使我們能夠用一個不具備 Mythos Preview 同等風險水準的模型來改進和完善這些措施。
Project Glasswing 的下一步計畫
今天的發布是一項長期努力的開端。要成功,需要技術產業內外的廣泛參與。
Project Glasswing 合作夥伴將獲得 Claude Mythos Preview 的存取權限,用於發現和修復其基礎系統中的漏洞和弱點——這些系統佔全球共享網路攻擊面的很大比例。預計工作重點包括在地漏洞偵測、二進位黑盒測試、端點加固和系統滲透測試。
Anthropic 為 Project Glasswing 及其他參與者承諾的 1 億美元模型使用額度,將涵蓋研究預覽期間的大量使用。之後,Claude Mythos Preview 將以每百萬輸入 / 輸出 token 25 美元 / 125 美元的價格向參與者提供(參與者可透過 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 存取該模型)。
除了模型使用額度,我們也透過 Linux 基金會向 Alpha-Omega 和 OpenSSF 捐贈了 250 萬美元,向 Apache 軟體基金會捐贈了 150 萬美元,幫助開源軟體維護者應對這一變化的格局(有興趣的維護者可以透過 Claude for Open Source 計畫申請存取)。
我們打算讓這項工作在範圍上持續擴展,持續數月,並盡可能多地分享經驗,讓其他組織也能將這些經驗應用於自身安全。合作夥伴將在條件允許的範圍內互相分享資訊和最佳實務;90 天內,Anthropic 將公開報告我們的發現,以及可以揭露的已修復漏洞和改進措施。我們也將與領先安全組織合作,制定一套關於 AI 時代安全實踐演進的實用建議,可能涵蓋:漏洞揭露流程、軟體更新流程、開源與供應鏈安全、軟體開發生命週期與安全設計實踐、受監管產業標準、分診擴展與自動化,以及補丁自動化。
Anthropic 也一直在與美國政府官員討論 Claude Mythos Preview 的攻防網路安全能力。保護關鍵基礎設施是民主國家的首要國家安全優先事項——這些網路安全能力的出現,再次說明了美國及其盟友必須在 AI 技術上保持決定性領先。政府在協助維持這一領先地位、評估與緩解 AI 模型相關國家安全風險方面扮演著不可或缺的角色。我們願意與各級政府代表合作協助完成這些任務。
我們希望 Project Glasswing 能促成一個涵蓋產業界與公共部門的更大規模努力,各方共同應對強大模型對安全影響的最大問題。我們邀請其他 AI 產業成員加入,協助制定產業標準。從中期來看,一個獨立的第三方機構——能夠彙集私營與公共部門組織——可能是承載這些大規模網路安全計畫後續工作的理想平台。
附注
該專案以玻璃翼蝶(Greta oto)命名。這個隱喻有兩層含義:蝴蝶透明的翅膀讓它能隱於無形,就像本文討論的那些藏在程式碼中的漏洞;透明的翅膀也幫助它躲避傷害,如同我們倡導的透明方法。
Mythos 一詞源自古希臘語,意為「敘事」或「故事」:文明用來理解世界的故事體系。
合法工作受到這些安全防護措施影響的安全專業人士,可以申請即將推出的網路安全驗證計畫(Cyber Verification Program)。