英國 AI 安全研究所（AISI）最新評測顯示，Anthropic 的 Claude Mythos Preview 能在受控環境下自主完成完整 32 步企業網路攻擊模擬的 AI 模型，在專家級 CTF 挑戰中達成 73% 成功率，標誌著 AI 網路攻擊能力跨越關鍵門檻。
（前情提要：Claude 正式支援修改 Word 檔案、工作流存成技能 skill，微軟 Office 三件套整合完成）
（背景補充：Anthropic AI 經濟指數萬字報告：自動化交易工作流頻率翻倍，Claude 正從工具變生活助理）

本文目錄

Toggle

CTF 評測：73% 專家級達標率
通關 32 步企業攻擊模擬
能力邊界
雙刃劍與組織應對

英國 AI 安全研究所（AISI）於 13 日發布針對 Anthropic Claude Mythos Preview 的網路安全能力評測報告。評測結果顯示，Mythos Preview 在前沿模型網路攻擊能力持續快速提升的背景下，代表了又一次顯著的能力躍升。

AISI 自 2023 年起追蹤 AI 網路攻擊能力，逐年建立難度遞增的評測體系：從基礎的對話式探測，到奪旗（CTF）挑戰，再到如今的多步驟網路攻擊模擬。此次評測採用最高 1 億 token 的推理預算執行網路靶場，而 Mythos Preview 的效能表現在這個上限內仍持續成長。

CTF 評測：73% 專家級達標率

奪旗挑戰（Capture The Flag，CTF）是網路安全評測的標準方法之一：AI 模型必須找出目標系統的漏洞並加以利用，取得隱藏的「旗標」字串。這類挑戰模擬真實攻擊情境中的單一技術環節，是衡量模型滲透測試能力的基準指標。

評測結果顯示，在「2025 年 4 月前沒有任何模型能完成」的專家級 CTF 任務中，Claude Mythos Preview 的成功率達到 73%。AISI 指出，這一數字標誌著前沿模型在孤立的單點攻擊技術上，已達到高度成熟的水準。

通關 32 步企業攻擊模擬

然而，專家級 CTF 僅測試單一技術能力。真實世界的網路攻擊需要在多臺主機、多個網路分段之間串聯數十個步驟，這類持續性行動往往需要人類專家耗費數小時、數天乃至數週才能完成。

為了更接近真實攻擊場景，AISI 建立了名為「最後倖存者」（The Last Ones，TLO）的企業網路攻擊模擬靶場。TLO 共設 32 個步驟，涵蓋從初始偵察到完整接管企業網路的全流程，AISI 估計人類專業人員完成這一流程需耗費約 20 小時。

Claude Mythos Preview 成為史上首個從頭到尾完整透過 TLO 的模型，在 10 次嘗試中有 3 次全數完成所有 32 步驟。即便計入失敗嘗試，Mythos Preview 平均完成步驟數為 22/32。相比之下，表現次佳的 Claude Opus 4.6 平均僅完成 16 步。

評測顯示，在明確指示並提供網路存取許可權的受控環境下，Mythos Preview 能夠執行多階段攻擊並自主發現及利用漏洞，而這些任務此前需要人類專業人員花費數天時間。

能力邊界

AISI 也補充指出現有評測框架與真實世界之間的差距。目前的靶場缺少真實環境中常見的多項防禦要素：沒有主動防禦者介入、沒有防禦工具部署，模型執行可能觸發安全警報的行動也不會受到任何懲罰。

AISI 坦言：「這意味著我們無法確定 Mythos Preview 是否能夠攻擊防禦完善的系統。」Mythos Preview 目前展現的能力，較準確的描述是：在已取得網路進入點的前提下，能夠自主攻擊規模較小、防禦薄弱且存在已知漏洞的企業系統。

雙刃劍與組織應對

AISI 的結論直接點出 AI 網路能力的雙重性質。一方面，更多具備類似能力的模型未來將持續湧現，對防禦薄弱的組織構成日益顯著的風險；另一方面，AI 網路能力同樣能在防禦端帶來突破性改善。

針對組織應對，AISI 強調網路安全基本功的緊迫性：定期套用安全更新、強健的存取控制、安全配置管理，以及完整的日誌記錄。AISI 指出，未來的前沿模型能力將更強，現在投入網路防禦建設至關重要。

在未來評測方向上，AISI 表示將建立模擬強化與防禦環境的靶場，納入主動監控、端點偵測與即時事件回應等要素，以更貼近真實攻擊場景的方式衡量 AI 網路攻擊能力的實際上限。

詳細報告請看【原文】

View Source

免責聲明：本頁面資訊可能來自第三方，不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考，不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證，對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為，價格波動劇烈，您可能損失全部投資本金。請充分了解相關風險，並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明。

全球風險投資飆升至 $300B 新高，2026 年第 1 季，AI 佔資金 80%

AI 行業動態

全球風險投資在 2026 年第一季達到 $300 十億美元，AI 公司獲得 $242 十億美元，較上一年成長 150%。主要投資推動了對市場集中度的擔憂，然而儘管面臨挑戰，對 AI 成長潛力的樂觀情緒仍然存在。

GateNews19分鐘前

Arthur Hayes 發文：聯準會未注入流動性前，比特幣難見顯著漲幅

價格預測股票 AI 行業動態

Arthur Hayes於4月15日在個人部落格分析比特幣走勢，指出在聯準會未注入流動性前，比特幣難以大幅上漲，設定的短期目標為80,000至90,000美元。他持有無槓桿多頭部位，對加密貨幣樂觀，並引用數據分析三大地緣政治情境。

Market Whisper1小時前

Aave Labs 推出 Aave Checkpoint，人工審核防範 DAO 治理風險

專案進展 AI 行業動態

Aave Labs於4月15日發布Aave Checkpoint，結合AI自動分析和強制人工審核，要求至少兩名審核員驗證治理提案。此系統自2026年3月運行，涵蓋預言機操縱等DeFi風險。同時，Aave V4引入再投資模組，動態配置閒置流動性，保持資金即時流動性。

Market Whisper1小時前

Anthropic 以國家安全為由限制 Mythos 模型公開發布

AI 行業動態

Anthropic限制其Claude Mythos AI模型的公開發布，因其在測試中顯示出自動化網路攻擊能力，對國家安全構成風險。參與「玻璃之翼」計畫的機構包括亞馬遜、蘋果、思科等，Anthropic提供1億美元資助。美國財政部及IMF也對Mythos的風險表示關注，強調防禦措施不足。

Market Whisper1小時前

台積電 Q1 營收超出預期，達到 113.4B 美元，受惠於 AI 晶片需求；Q2 展望偏正面

股票 AI 行業動態

台灣的台積電（TSMC）公布2026年第一季營收為113.4億美元，受到高性能運算（HPC）晶片需求帶動，並超出預期。營業利潤率上升至58.1%。先進製程（advanced-nodes）占據了相當可觀的營收，且AI訂單表現強勁。第二季指引也超過市場預期。

GateNews1小時前

黃仁勳最新專訪：輝達的護城河能否繼續保持？（上）

股票 AI 行業動態

NVIDIA執行長黃仁勳在專訪中指出，AI競爭不只是單一模型或晶片，而是涉及多層面的複雜生態。他認為NVIDIA在「從電子到token」的轉換中負責關鍵部分，難以被商品化。面對市場質疑，黃仁勳表示NVIDIA的供應鏈優勢及對上游投資將持續推動成長。他相信，AI將促進工具型軟體公司發展，而不是取代。對於產業瓶頸，他認為大多數可在兩到三年內解決，唯有能源政策是長期挑戰。

鏈新聞abmedia1小時前

留言

0/400

暫無留言