Todos os posts
cybersecurityaiagentszero-trustgovernance

Claude Mythos achou um bug de 27 anos no OpenBSD — e por que a Anthropic não vai liberar essa IA

Gustavo Velozo · · 8 min read

Em algumas semanas, uma IA da Anthropic encontrou milhares de vulnerabilidades zero-day em sistemas operacionais críticos, navegadores e infraestrutura usada por bilhões de pessoas. Entre elas, uma falha de crash remoto no OpenBSD que existia desde os anos 90 — 27 anos sem ninguém detectar, em um dos sistemas mais endurecidos do mercado.

A Anthropic então fez algo raro: decidiu não liberar o modelo ao público. Em vez disso, lançou o Project Glasswing, um consórcio coordenado com Microsoft, Apple, Google, Amazon, NVIDIA, Cisco, CrowdStrike, Linux Foundation, Palo Alto Networks e mais de 40 organizações de infraestrutura crítica. O modelo se chama Claude Mythos.

Esse vídeo-artigo cobre o que a IA pode fazer, por que está contida e — o ponto que importa mais — o que muda para a sua empresa a partir de agora.

O que é o Project Glasswing

Anunciado em 7 de abril de 2026, o Project Glasswing tem um objetivo bem específico: encontrar vulnerabilidades nos softwares mais críticos do mundo antes que atores ofensivos consigam.

A frase que a Anthropic publicou, sem eufemismos, é reveladora:

Construímos uma IA melhor do que quase qualquer humano em encontrar e explorar falhas de cibersegurança.

E completaram: lançar essa capacidade ao público seria perigoso demais.

A iniciativa envolve US$ 100 milhões em créditos do Mythos Preview distribuídos aos parceiros, mais US$ 4 milhões em doações diretas para projetos de segurança open-source. Não é só marketing — embora tenha um componente de marketing, há substância técnica para sustentar o anúncio.

O que torna o Mythos diferente de scanners convencionais

Quem trabalha com cibersegurança conhece scanners de vulnerabilidade clássicos: eles fazem varredura de sistema e identificam falhas isoladas. O Mythos faz algo qualitativamente diferente.

Citação direta de Nicholas, pesquisador da Anthropic responsável pelo modelo:

It has the ability to chain together vulnerabilities. This model is able to create exploit out of like three, four, sometimes five vulnerabilities.

Tradução prática: o modelo encontra falhas isoladas e consegue compor cadeias de ataque sofisticadas — o tipo de raciocínio combinatório que separa bons pentesters de hackers de elite. Poucos humanos no mundo conseguem montar exploits multi-estágio nessa escala. O Mythos consegue, em horas.

O dado mais relevante para entender o tamanho do risco: mais de 99% das vulnerabilidades encontradas ainda não foram divulgadas publicamente. O processo de coordinated disclosure está em andamento com as empresas responsáveis. Se essa lista vazasse hoje, o caos seria imediato — atacantes teriam um catálogo pronto de zero-days antes que os fabricantes pudessem distribuir patches.

Por que o bug de 27 anos no OpenBSD importa

Para quem é da área, o caso OpenBSD é o mais simbólico do anúncio. OpenBSD é famoso pela sua postura de segurança rigorosa — é o sistema que muita gente roda por padrão em deployments que exigem máximo endurecimento. Encontrar uma vulnerabilidade ali não é encontrar uma falha em mais um software qualquer. É encontrar uma falha em um sistema desenhado especificamente para não ter falhas.

E essa falha estava lá desde os anos 90.

A leitura é desconfortável: sistemas que consideramos maduros, estáveis e auditados podem estar carregando problemas estruturais que humanos simplesmente nunca encontraram — porque humanos são lentos, caros e o ROI da auditoria manual a esse nível é baixo demais para justificar o investimento.

A IA muda essa equação. E a velocidade de descoberta de bugs vai escalar de uma forma que nossos processos de remediação atuais não estão preparados para acompanhar.

A validação independente: o benchmark CTI Realm

Se você está cético — "ok, mais um anúncio de IA, como sei se é real?" — a Microsoft publicou recentemente, via Cornell University, um paper apresentando o CTI Realm: um benchmark open-source para avaliar agentes de IA em cibersegurança. E é aqui que fica interessante.

O CTI Realm não testa o básico. Não pergunta "qual é o nome da técnica X do MITRE ATT&CK?". Em vez disso, simula o workflow completo de um analista de segurança real:

A Microsoft avaliou 16 configurações de modelos atuais nesse benchmark. Os modelos da Anthropic lideraram, principalmente por uso superior de ferramentas e refinamento iterativo de queries. O Mythos Preview demonstrou melhorias substanciais em relação a modelos anteriores.

O paper é público — vale o download para quem quer entender a metodologia em detalhe.

Como o Mythos vai chegar ao mercado

Detalhe importante: você não vai acessar o Mythos Preview pela API direta da Anthropic. A distribuição vai ser via Microsoft Foundry, a plataforma gerenciada de agentes de IA da Azure. A Azure se posiciona como o hub de segurança de ponta para organizações aprovadas no programa.

Significa que o acesso é restrito, controlado, e sujeito a aprovação caso-a-caso. Não é "abre uma conta e usa".

A frase mais honesta do anúncio veio em uma linha discreta:

This level of capability will not remain unique to a single model or provider.

A questão não é se outros modelos com essa capacidade vão chegar. É quando, e em quais mãos.

O que muda na prática para você — quatro frentes

1. Seu ciclo de patching vai quebrar se você não agir agora

Se sistemas com 27 anos têm vulnerabilidades que humanos nunca encontraram, considere o passivo escondido em todo o seu stack. A velocidade de descoberta vai acelerar brutalmente. Se o seu processo de remediação não acompanha o ritmo atual, com IA acelerando do lado defensivo (e em breve do ofensivo), vai virar lenha na fogueira.

Tática: auditar o ciclo de patching ponta-a-ponta. Tempo médio de aplicação por severidade. Cobertura por classe de sistema. SLAs documentados e medidos. Se você não consegue responder essas perguntas em 30 segundos, é a primeira coisa para resolver.

2. Open source é o calcanhar de Aquiles

Os US$ 4 milhões em doações da Anthropic para projetos de segurança open-source parecem generosos — mas revelam o problema real. Projetos open-source críticos são mantidos por times pequenos, frequentemente voluntários. O Mythos consegue encontrar bugs mais rápido do que esses projetos conseguem corrigir.

Tática: mapear suas dependências open-source críticas. Quem mantém? Qual o tempo médio de resposta a CVEs? Você tem plano B se o mantenedor sumir? Diversificação não é só financeira.

3. Aplicar Zero Trust também aos modelos de IA

Aqui está o ponto onde a maioria das organizações está descoberta. Você não pode tratar agentes de IA como entidades confiáveis por padrão. Os princípios do framework Zero Trust precisam se estender para os pipelines de IA:

4. Modernizar a camada de software no ciclo de desenvolvimento

Defender na velocidade da IA não é mais opcional. Quando atacantes começarem a usar agentes equivalentes ao Mythos para varredura ofensiva, o delta entre quem tem agentes defensivos no SDLC e quem não tem vai ser brutal.

Tática: integrar análise estática contínua + agentes de revisão de código adversariais (não apenas colaborativos) + telemetria de runtime + resposta automatizada a sinais. O technical debt de quem não embarcou em workflows agentic está crescendo todo mês.

A crítica honesta: nem tudo são certezas

Bruce Schneier — um dos especialistas independentes de segurança mais respeitados do mundo — publicou uma crítica ao anúncio que merece atenção. O argumento central: a maior parte das vulnerabilidades alegadas não foi divulgada porque ainda não foi corrigida. O público está sendo pedido para confiar em evidências que ainda não pode verificar.

Schneier tem razão em apontar isso. Repórteres têm repetido as alegações da Anthropic sem engajamento crítico suficiente.

Ao mesmo tempo, há evidências técnicas concretas: os parceiros do consórcio (Microsoft, Apple, Google, Amazon, etc.), o framework CTI Realm com benchmark verificável, os papers públicos. As alegações são extraordinárias e por isso requerem escrutínio extraordinário — mas não são vazias.

A natureza dual-use é o ponto que precisa ser nomeado: a mesma IA usada para encontrar vulnerabilidades defensivamente pode ser usada ofensivamente quando equivalentes chegarem ao mercado aberto. Isso não é hipotético — é a natureza do que foi construído.

É exatamente por isso que o acesso é restrito hoje. E é exatamente por isso que a corrida para fortalecer sistemas precisa começar antes que modelos similares se proliferem.

A leitura final

O Project Glasswing não é pesquisa acadêmica. É uma resposta de emergência coordenada pelas maiores empresas de tecnologia do planeta a uma capacidade que elas próprias acabaram de descobrir que existe.

Para CISOs, líderes de segurança e arquitetos de cloud: este não é um anúncio para arquivar. É um sinal de que o calendário de planejamento de cibersegurança da sua empresa precisa ser refeito — provavelmente este trimestre.

Melhor checar agora do que remediar dano depois.


Este artigo foi gerado a partir do meu vídeo no YouTube. Assista a versão completa para a discussão das implicações estratégicas e o detalhamento dos quatro pilares de ação.

Prefere vídeo?

Assistir no YouTube

Posts relacionados