AI-аудит выходит на практическую стадию, OpenAI выпустила EVMbench, укрепляя оценку безопасности смарт-контрактов

ETH2,64%
WELL5,77%

OpenAI совместно с Paradigm запускает EVMbench, тестирование возможностей AI-агентов в защите и атаке смарт-контрактов EVM, выявляя слабые стороны и сильные стороны.

Фокус на реальных условиях экономики, OpenAI и Paradigm укрепляют безопасность блокчейна

Лидер в области искусственного интеллекта OpenAI объявил о сотрудничестве с известной компанией по рисковым инвестициям в криптовалюты Paradigm и компанией по безопасности OtterSec для запуска EVMbench — инструмента для оценки безопасности AI-агентов в контексте смарт-контрактов Ethereum Virtual Machine (EVM).

По мере углубления интеграции AI и криптотехнологий, смарт-контракты становятся ключевой инфраструктурой для управления более чем триллионом открытых криптоактивов. Появление этого инструмента символизирует начало осознания индустрией практических возможностей AI в условиях «экономически значимой среды».

Команда OpenAI отмечает, что с ростом возможностей AI-агентов в написании и планировании кода, в будущем эти модели будут играть трансформирующую роль в атаках и защите блокчейна. Поэтому создание стандартизированной системы оценки становится критически важным для мониторинга прогресса AI.

Три основных режима тестирования, 120 реальных уязвимостей — испытание на прочность AI

Ядро EVMbench построено на базе 120 уязвимостей, извлечённых из 40 профессиональных аудиторских отчётов, включая известные публичные конкурсы по аудиту Code4rena, что обеспечивает реалистичность сценариев. Стандарт включает три режима оценки AI-агентов:

Источник: OpenAI EVMbench — ядро системы заключается в оценке AI-агентов в трёх режимах работы

  • Первый — «Обнаружение (Detect)», где AI анализирует код смарт-контракта и выявляет известные уязвимости, оценивая их степень серьёзности;
  • Второй — «Исправление (Patch)», где AI должен устранить уязвимости и исправить код, сохраняя при этом исходную функциональность;
  • Третий — «Эксплуатация (Exploit)», где AI в изолированной среде блокчейна выполняет полный цикл атаки с целью кражи средств.

Для обеспечения строгой повторяемости и надёжности тестирования команда разработала архитектуру на базе Rust, использующую детерминированное воспроизведение транзакций для проверки успешности атак или исправлений AI.

Тенденция усиления атак и слабых защит очевидна, GPT-5.3-Codex демонстрирует впечатляющий рост в атакующих способностях

В первых результатах тестирования видно, что AI показывает значительные различия в эффективности в зависимости от задачи. Новое поколение GPT-5.3-Codex показывает отличные результаты в режиме эксплуатации (Exploit Mode), набрав 72,2 %, что значительно превосходит показатели GPT-5, выпущенной всего шесть месяцев назад (31,9 %), демонстрируя поразительный рост возможностей.

Источник: Обзор результатов различных моделей AI OpenAI в трёх режимах

Это свидетельствует о том, что при ясной цели «вывести средства из системы» AI обладает мощными возможностями по планированию и выполнению атак. Однако в защитных сценариях показатели остаются слабее: AI часто останавливается после обнаружения одной уязвимости и не продолжает поиск, а при исправлении сложных логик зачастую не удаётся устранить уязвимость без нарушения работы контракта. Эксперты по безопасности выражают обеспокоенность, что AI может значительно сократить время от обнаружения уязвимости до разработки атаки, что повышает требования к скорости защиты DeFi-проектов.

Привлечение талантов и поддержка защиты, стратегия OpenAI по обеспечению безопасности AI-экосистемы

Помимо разработки инструментов, OpenAI активно занимается привлечением специалистов и укреплением экосистемы защиты. Недавно был нанят основатель проекта открытых AI-агентов OpenClaw Питер Штайнбергер, который возглавит разработку следующего поколения персонализированных агентов и преобразует проект в фонд, поддерживаемый OpenAI.

Для противодействия возможным киберрискам, связанным с AI, OpenAI обещает выделить 10 миллионов долларов на гранты по кибербезопасности через свою программу поддержки, чтобы финансировать разработку открытых инструментов защиты и исследование ключевой инфраструктуры. Эта инициатива особенно актуальна после инцидента с протоколом Moonwell, где из-за ошибки в коде, связанной с AI, было потеряно около 1,78 миллиона долларов.

Дополнительные материалы
Отказ от миллиардных предложений Meta, создатель OpenClaw присоединяется к борьбе за таланты в OpenAI, предсказания о сбоях в протоколе Moonwell — кто заплатит за убытки в 1,78 миллиона долларов?

В будущем, по мере внедрения более автоматизированных и AI-ассистированных платежных решений и автоматизированных кошельков, использование таких инструментов, как EVMbench, для различения моделей, способных только описывать уязвимости, и моделей, способных надёжно обеспечивать защиту, станет ключевым моментом в развитии индустрии блокчейн-безопасности.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Circle представляет инструменты блокчейна AI Skills для USDC, EURC

Circle Skills позволяет AI агентам выполнять платежи, операции с кошельками и действия смарт-контрактов, используя USDC и EURC. Инструмент интегрируется с AI платформами, такими как Cursor, Claude Code и Codex, для более быстрого создания приложений на стейблкоинах. Circle протестировала AI агентов с помощью $30K USDC хакатона, который создал 204

CryptoFrontNews1ч назад

USDS стабилизируется, так как Sky Protocol проверяет 70M для Sky Agent Network

Статус: Отсутствует верифицированное одобрение для выделения 70 миллионов USDS Отсутствует документированное одобрение управления для выделения "70 миллионов USDS" к Sky Agent Network. Официальные одобрения в этой экосистеме требуют опубликованного предложения, записанного голосования и отслеживаемых on-chain платежей, ни одного из которых нет

CoincuInsights6ч назад

Aave опубликовал анализ инцидента: пользователи потеряли 50 миллионов долларов из-за недостатка ликвидности, сам протокол не пострадал

Aave опубликовала 15 марта аналитический отчет о потерях пользователей в размере 50 млн долларов при обмене из-за недостаточной ликвидности, подчеркивая, что убытки были вызваны тем, что пользователи подтвердили плохие котировки. Для предотвращения подобных событий будет запущен Aave Shield, который ограничит влияние на цену.

GateNews6ч назад

Pump.fun запускает автоматические выкупы для токенизированных AI-агентов

Pump.fun улучшает экономику криптовалют, управляемую искусственным интеллектом, автоматизируя выкупы токенов агентов и связывая успех с сообществом держателей. Доход от $SOL или $USDC покупает и сжигает токены, решая проблемы накопления стоимости и стимулируя вовлечение. Разработчики могут регулировать ставки выкупа, обеспечивая упрощенный процесс для запуска токенизированных агентов.

CryptoFrontNews7ч назад

Sky Protocol одобрил 70 миллионов токенов USDS для поддержки этапа запуска Sky Agent

Sky Protocol Governance Committee одобрила распределение 70 миллионов USDS для поддержки стадии запуска Sky Agent. Распределение средств включает по 25 миллионов USDS для Keel, Amatsu и Ozone, а также 10 миллионов USDS для нераскрытого агента. Средства будут переведены после голосования 26 марта и останутся под контролем протокола.

GateNews7ч назад

После обновления сети: Какие перспективы ждут SOL?

Официальное одобрение протокола SIMD-0266 направлено на оптимизацию эффективности вычислений в сети Solana путем введения p-токенов, упрощения обработки транзакций. Это обновление, запланированное на апрель, спровоцировало повышенную активность покупок и может привести к значительному снижению затрат и улучшению производительности.

TapChiBitcoin8ч назад
комментарий
0/400
Нет комментариев