Institut de recherche sur la sécurité de l'IA au Royaume-Uni : Claude Mythos Preview devient la première IA à réaliser une simulation d'attaque réseau d'entreprise autonome en franchissant 32 étapes

ME News Actualités, le 14 avril (UTC+8), selon la surveillance de 1M AI News, l’Institut britannique de recherche sur la sécurité de l’IA (AISI) a publié l’évaluation des capacités de cybersécurité de Claude Mythos Preview. Sur une tâche CTF de niveau expert (difficulté qu’aucun modèle ne pourra réaliser avant avril 2025), le taux de réussite de Mythos Preview atteint 73 %. L’AISI a également construit le scénario de simulation d’attaque réseau d’entreprise en 32 étapes « The Last Ones » (TLO), couvrant tout le processus depuis la reconnaissance initiale jusqu’à la prise de contrôle complète du réseau, nécessitant environ 20 heures pour un humain. Mythos Preview est le premier modèle à réussir la totalité du parcours, avec 3 réussites sur 10 tests, chaque tentative moyenne atteignant 22 étapes. Claude Opus 4.6 se place en deuxième position, avec une moyenne de 16 étapes complétées. L’AISI précise que ces résultats ont été obtenus dans des conditions contrôlées où l’accès au réseau était clairement guidé et fourni. L’environnement de test diffère significativement d’un réseau d’entreprise réel : absence de défense active, pas d’outils de défense, et aucune punition en cas de déclenchement d’alertes de sécurité. Il n’est donc pas possible de confirmer si Mythos Preview peut pénétrer un système fortement protégé. Il y a deux ans, les meilleurs modèles d’IA ne pouvaient presque pas réaliser des tâches réseau de base. L’AISI souligne que cette vitesse de progrès exige une mise à jour des méthodes d’évaluation de la sécurité, et des tests continueront dans des environnements simulant une défense active et une réponse en temps réel. (Source : BlockBeats)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler