Antevisão do Claude Mythos: IA não lançada da Anthropic explorou falhas do Linux e do OpenBSD que os humanos não notaram durante décadas

Coinpedia

A pré-visualização não lançada do Claude Mythos da Anthropic identificou autonomamente milhares de vulnerabilidades zero-day de alta criticidade em todos os principais sistemas operativos e navegadores web, levando a empresa a lançar o Project Glasswing, uma coligação defensiva de cibersegurança apoiada por até $100 milhões em créditos de utilização de IA.

Principais conclusões:

  • A pré-visualização Claude Mythos da Anthropic obteve 83,1% no Cybergym, encontrando milhares de zero-days em todos os principais sistemas operativos e navegadores.
  • O Project Glasswing foi lançado a 7 de abril de 2026, com 11 parceiros fundadores e até $100 milhões em créditos de utilização do Mythos para defensores.
  • Uma falha no OpenBSD, com 27 anos, e um bug do FFmpeg, com 16 anos, sobreviveram a milhões de testes automatizados até que o Mythos os encontrou em poucas horas.

IA Claude Mythos com 83% no Cybergym e encontrou falhas críticas em todos os principais browsers e sistemas operativos

O modelo, que a Anthropic descreve como o maior ganho de capacidade num único modelo na história da IA de fronteira, concluiu o treino e foi anunciado publicamente a 7 de abril de 2026, depois de detalhes internos terem surgido no final de março através de um sistema de gestão de conteúdos mal configurado que expôs aproximadamente 3.000 ficheiros internos.

A Anthropic não está a disponibilizar a pré-visualização Claude Mythos ao público nem através da sua API geral. A empresa restringiu o acesso a um grupo de parceiros previamente validado depois de o modelo demonstrar que conseguia descobrir e explorar falhas desconhecidas de software, a uma velocidade e escala que ultrapassam tanto especialistas humanos como sistemas de IA anteriores.

Em benchmarks de cibersegurança, a diferença entre Mythos e Claude Opus 4.6 é difícil de ignorar. O Mythos marcou 83,1% no Cybergym, face a 66,6% para o Opus 4.6, e 93,9% face a 80,8% no SWE-bench Verified. No SWE-bench Pro, obteve 77,8% contra 53,4% — uma diferença de 24 pontos. Atingiu 56,8% no Humanity’s Last Exam sem ferramentas, em comparação com 40,0% para o seu antecessor.

O modelo não precisa de treino específico para cibersegurança para encontrar estes bugs. Os seus avanços provêm de melhorias mais abrangentes em raciocínio, planeamento multi-etapa e comportamento autónomo de agentes. Com uma base de código-alvo num contentor isolado, lê o código-fonte, formula hipóteses sobre falhas de segurança da memória, compila e executa o software, usa depuradores como o Address Sanitizer, classifica ficheiros por probabilidade de vulnerabilidade e produz relatórios de bugs validados com exploits de prova de conceito que funcionam.

Alguns desses exploits exigiram quase nenhuma direção humana. Tomshardware.com relata que uma vulnerabilidade TCP SACK do OpenBSD, com 27 anos, um overflow de inteiros subtil que permite que um atacante faça crash remotamente qualquer host em resposta ao envio de pacotes maliciosos, foi encontrada de forma autónoma após cerca de 1.000 execuções, com um custo total abaixo de $20.000. Um bug do FFmpeg H.264, com 16 anos, sobreviveu a mais de cinco milhões de testes automatizados e a múltiplas auditorias antes de o Mythos o detetar.

Os resultados do navegador mereceram particular atenção. No teste do motor JavaScript do Firefox 147, o Mythos produziu 181 exploits de shell completos e 29 casos de controlo de registos. O Claude Opus 4.6 produziu dois exploits de shell no mesmo conjunto de testes. O modelo também construiu cadeias de escalada de privilégios do kernel Linux, de utilizador para root em servidores, depois de filtrar 100 CVEs recentes até 40 candidatos exploráveis e de explorar com sucesso mais de metade.

Validadore(s) humanos analisaram 198 dos relatórios de vulnerabilidade do modelo e concordaram com as suas classificações de criticidade 89% das vezes, com 98% de concordância dentro de um nível de criticidade.

Project Glasswing

Menos de 1% das falhas identificadas foi totalmente corrigida até agora. A Anthropic está a coordenar a divulgação responsável, publicando compromissos criptográficos SHA-3 para questões ainda não corrigidas, e a seguir um calendário de 90-plus-45 dias antes de publicar detalhes completos. O bug de execução remota de código no servidor NFS do FreeBSD, CVE-2026-4747, com 17 anos, que concede acesso root completo não autenticado, está entre os exemplos nomeados que já foram incluídos na divulgação.

Claude Mythos Preview: Anthropic's Unreleased AI Cracked Linux and OpenBSD Bugs Humans Missed for Decades

O Project Glasswing, anunciado em paralelo com o modelo, é a tentativa da Anthropic de direcionar estas capacidades para a defesa antes que ferramentas semelhantes fiquem amplamente disponíveis. Os parceiros fundadores incluem Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, a Linux Foundation, Microsoft, Nvidia e Palo Alto Networks. O acesso está a ser alargado a mais de 40 organizações críticas adicionais de software.

A Anthropic comprometeu $4 milhões em doações de segurança open-source: $2,5 milhões para a Alpha-Omega através da OpenSSF via a Linux Foundation, e $1,5 milhões para a Apache Software Foundation.

A empresa reconheceu que ferramentas de IA como o Mythos reduzem a barreira para encontrar e explorar vulnerabilidades, e apontou o risco no curto prazo por parte de atores estatais — China, Irão, Coreia do Norte e Rússia — e de grupos criminosos, caso capacidades semelhantes se espalhem sem controlos. Descreveu um período de agitação transitória antes de os defensores integrarem plenamente a tecnologia.

A Anthropic afirmou que as próximas versões do Claude Opus incluirão salvaguardas para detetar e bloquear resultados perigosos de cibersegurança, e planeia introduzir um Cyber Verification Program para profissionais de segurança previamente validados. Espera-se que um relatório público sobre os achados dos parceiros e as vulnerabilidades corrigidas seja publicado dentro de 90 dias.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários