Штучний інтелект для аудиту виходить у реальну практику, OpenAI випустила EVMbench, посилюючи безпеку оцінки смарт-контрактів

ETH-0,18%
WELL2,31%

OpenAI спільно з Paradigm запускає EVMbench, що тестує здатність AI-агентів до атак і захисту в смарт-контрактах EVM, викриваючи слабкі місця та переваги.

Зосереджуючись на реальних економічних умовах, OpenAI у партнерстві з Paradigm посилює оцінку безпеки блокчейну

Лідер у сфері штучного інтелекту OpenAI оголосив про співпрацю з відомою компанією з ризикових інвестицій у криптовалюти Paradigm та компанією з безпеки OtterSec для запуску базового інструменту EVMbench, який оцінює безпеку AI-агентів у контексті Ethereum Virtual Machine (EVM).

Зі зростанням інтеграції AI та криптотехнологій, смарт-контракти стали ключовою інфраструктурою для управління понад 100 мільярдами відкритих криптоактивів. Вихід цього інструменту символізує початок серйозного ставлення галузі до практичних можливостей AI у «економічно значущих» середовищах.

Команда OpenAI зазначає, що з розвитком здатностей AI-агентів у написанні та плануванні коду, ці моделі у майбутньому відіграватимуть трансформуючу роль у атаках і захисті блокчейнів, тому створення стандартної системи оцінки є надзвичайно важливим для моніторингу прогресу AI.

Три основні режими тестування, 120 реальних вразливостей — випробування для AI

Ядро EVMbench побудоване навколо 120 високоризикових вразливостей, витягнутих із 40 професійних аудитів, зокрема з відомих відкритих конкурсів аудиту Code4rena, що забезпечує реалістичність сценаріїв тестування. Стандарт оцінки оцінює AI-агентів у трьох режимах роботи:

Зображення: Основна концепція EVMbench — оцінка AI-агентів у трьох режимах роботи

  • Перший — «Режим виявлення (Detect)», коли AI аналізує код контракту та ідентифікує відомі вразливості, оцінюючи їхню серйозність;
  • Другий — «Режим виправлення (Patch)», де AI має зберегти функціональність контракту, одночасно видаляючи вразливості та виправляючи код;
  • Третій — «Режим експлуатації (Exploit)», коли AI у ізольованому середовищі імітує атаки з крадіжки коштів.

Щоб забезпечити точність і повторюваність тестів, команда розробила тестову архітектуру на базі Rust, яка використовує детальне відтворення транзакцій для перевірки успішності атак або виправлень AI.

Значний тренд — перевага атак, GPT-5.3-Codex демонструє вражаючий ріст у здатності до атак

Перші результати тестування показали, що AI демонструє значні відмінності у здібностях залежно від завдання. Найновіша модель GPT-5.3-Codex показала високий результат у режимі експлуатації (Exploit Mode) — 72.2 %, що значно перевищує 31.9 %, показані у моделі GPT-5, випущеній лише шість місяців тому, що свідчить про неймовірний прогрес.

Зображення: Огляд результатів різних моделей AI у трьох режимах

Це свідчить про те, що при цілі «повністю вивести кошти» AI має потужні можливості для ітеративного планування та виконання атак. Водночас, у захисних функціях AI показує слабкі результати: у режимі виявлення він часто зупиняється після знаходження однієї помилки, а при складних логіках — важко виправити вразливості без порушення роботи контракту. Експерти з безпеки висловлюють занепокоєння, що AI може значно скоротити час від виявлення вразливості до створення атаки, що ставить під високий ризик DeFi-проєктів і вимагає швидшої реакції.

Привлечение талантів і підтримка захисту — стратегія OpenAI щодо безпеки екосистеми AI-агентів

Крім розробки інструментів, OpenAI активно залучає фахівців і розвиває екосистему захисту. Нещодавно компанія найняла засновника проекту відкритих AI-агентів OpenClaw Пітера Штайнбергера для керівництва розробкою наступного покоління персоналізованих агентів, перетворюючи цей проект у фонд OpenAI.

Щоб протистояти потенційним кіберризикам, OpenAI пообіцяв виділити 10 мільйонів доларів через свою програму підтримки безпеки для фінансування відкритих інструментів захисту та досліджень ключової інфраструктури. Це особливо актуально після інциденту з протоколом Moonwell, де через помилку у коді AI сталася втрата близько 1,78 мільйона доларів.

Додаткові матеріали
Відмова від багатомільярдної пропозиції Meta, приєднання творця OpenClaw до OpenAI — боротьба за таланти, чи все через Vibe Coding? Прогноз Moonwell — збитки на 1,78 мільйона, хто заплатить?

У майбутньому, з появою все більшої кількості AI-помічників для стабільних монет і автоматизованих гаманців, важливо буде використовувати EVMbench для розрізнення моделей, які лише описують вразливості, і тих, що здатні надійно забезпечити захист, що стане ключовим моментом у розвитку галузі безпеки блокчейну.

Переглянути оригінал
Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Aave 回應五千萬鎂 Swap 事故:用戶誤接受 99.9% 價格衝擊,Aave 將推出 Shield 防護機制

去中心化借貸協議 Aave 最近發布事故報告,說明 3 月 12 日一名用戶在其平台上進行大額 Swap 交易時,由於市場流動性不足,最終只獲得約 3.6 萬美元的 AAVE。Aave 強調該事件非因協議漏洞,而是用戶接受了極端不利報價,並計劃推出新的安全機制 Aave Shield 以降低未來誤操作的風險。

ChainNewsAbmedia56хв. тому

以太坊基金會場外出售 5000 枚 ETH 給 BitMine,Tom Lee:以太坊正處小熊市末期

以太坊基金會宣布透過場外交易向BitMine出售5,000枚ETH,平均價格為2,042.96美元,總值約1,022萬美元。出售所得將用於支持協議研發、生態建設及社區資助。BitMine持有ETH總量已增至約453萬枚,朝向掌握全球5%供應量的目標邁進。

動區BlockTempo1год тому

USDH 发行方 Native Markets 推出代币化保证金产品 pmUSDH

3月15日,Hyperliquid原生稳定币USDH的发行方Native Markets推出了代币化保证金产品pmUSDH,用户可将存入的USDH转化为ERC-20格式的pmUSDH。该代币不仅可获取借款利息,还能在多个DeFi协议中使用。

GateNews1год тому

Aave 就「将年回购预算从 5000 万美元下调至 3000 万美元」进行投票,当前支持率 99.37%

Aave DAO 正在对将年度回购预算从 5000 万美元下调至 3000 万美元的提案进行投票,当前支持率为 99.37%。提案因收入下降和预算赤字而提出,若通过将进入正式投票阶段。

GateNews2год тому

Vitalik 解读以太坊基金会新使命:将加倍投入并推动其成为"技术避风港"

Vitalik Buterin在X平台解读以太坊基金会的新使命宣言,强调以太坊作为“技术避风港”的独特角色,致力于维护技术自我主权,防止绝对控制,并推进CROPS原则,关注去中心化与用户体验,以推动以太坊生态发展。

GateNews2год тому

Aave 将推出 Aave Shield 功能,默认阻止价格影响超 25% 的 Swap

Aave 发布了 Swap 事件复盘,称一用户在流动性低的市场执行超大订单,导致价格影响约99.9%。Aave 将推出 Aave Shield 功能,默认阻止价格影响超过25%的交易。

GateNews2год тому
Прокоментувати
0/400
Немає коментарів