Todos os posts
aicybersecurityagentsgovernance

Claude Mythos: o modelo que está aterrorizando pesquisadores de segurança em São Francisco

Gustavo Velozo · · 8 min read

Em um evento recente de cibersegurança em São Francisco, uma das empresas mais respeitadas do setor subiu ao palco com uma declaração que reverberou pela comunidade: o Claude Mythos — o novo modelo da Anthropic ainda em preview — encontrou uma vulnerabilidade zero-day no GhostScript, um repositório auditado por anos pelos melhores pesquisadores de segurança do planeta. Em minutos.

Os pesquisadores que viveram a vida inteira caçando vulnerabilidades estão alarmados. E não é hype interno da Anthropic — é a fala de profissionais independentes que constroem suas reputações justamente em encontrar essas falhas.

Como alguém que trabalha com cibersegurança há mais de 10 anos, atuou em projetos para grandes empresas e construiu ferramentas próprias de modelagem de ameaças que ficaram TOP 10 entre mais de mil projetos em hackathons da Microsoft, eu posso afirmar com tranquilidade: isso não é hype. Estamos vivendo um possível ponto de inflexão.

O que torna o Mythos diferente dos modelos anteriores

O Mythos não é apenas mais um modelo. É o primeiro modelo da Anthropic treinado nos novos chips Nvidia GB300 — a geração mais recente da arquitetura de data center para IA, com um salto de performance que não víamos há muito tempo.

A nomenclatura também muda: até agora, a Anthropic seguiu a convenção Sonnet (rápido) e Opus (flagship, mais inteligente, mais caro). O Mythos sinaliza uma nova linhagem — provavelmente porque o modelo opera em uma escala diferente do que vimos antes.

E aqui entra a scaling law na prática. Quando um modelo cresce em escala suficiente, ele não fica apenas 10% melhor em tudo. Ele dá um salto qualitativo — começa a fazer coisas que modelos menores simplesmente não conseguiam fazer, por mais que você refinasse o prompt. Encontrar zero-days em repositórios auditados é exatamente esse tipo de capacidade emergente.

Para uma análise mais profunda do contexto do Mythos no Project Glasswing da Anthropic — incluindo o caso do bug de 27 anos no OpenBSD — recomendo o meu artigo anterior sobre o tema.

A primeira coisa para fazer no dia 0 do lançamento

Quando o Mythos for liberado publicamente, qualquer pessoa terá em mãos uma ferramenta capaz de escanear estruturas e passar despercebida por muitas barreiras de segurança convencionais. É faca de dois gumes.

A primeira ação se você trabalha com cibersegurança: aponte o Mythos para os seus próprios sistemas antes que outros apontem. Faça com que ele leia seu ambiente. É exatamente o que vou fazer com a minha ferramenta de modelagem de ameaças — alimentá-la com o Mythos para iniciar uma rodada nova de testes contra os ambientes que ela já conhece.

Mas segurança é só o começo. Esse modelo vai mudar como você constrói coisas, como você trabalha e como você compete no mercado. Para entender por quê, preciso compartilhar uma lição amarga que aprendi trabalhando com LLMs.

A lição amarga: quanto mais inteligente o modelo, mais simples seu prompt

Vou te dar um exemplo pessoal. Tinha um prompt de 10 linhas, super detalhado, metodologia clara, fontes específicas, processo bem estruturado. Era o resultado de meses de ajustes. Sempre me entregava exatamente o que eu queria.

Um dia, na correria, joguei na ferramenta um prompt simples de duas linhas — algo como a gente escreve naturalmente.

O resultado foi melhor.

O prompt longo, super especificado, estava limitando o que o modelo já sabia fazer sozinho. Quando o modelo evolui, ele já sabe melhor que você como pesquisar, estruturar, validar. Toda aquela engenharia de prompt vira atrito.

Esse padrão vai ser dramaticamente amplificado pelo Mythos. Quem não estiver preparado vai entrar em conflito com o modelo em vez de deixá-lo trabalhar. A nova arte do prompt não é o que você coloca — é o que você deixa de fora.

Quatro implicações práticas — comece a se preparar agora

A partir do que venho lendo e estudando sobre o Mythos, separei quatro frentes onde a maioria das aplicações vai precisar ser repensada.

1. Revisar todos os seus prompts (e cortar 40% deles)

A pergunta que você precisa fazer para cada bloco de prompt: este texto existe porque o modelo precisa, ou porque eu achei que o modelo precisaria?

A recomendação é alinhada entre a Anthropic e a OpenAI (que tem orientações similares no guia do Codex): adicione complexidade somente quando ela demonstrar melhorar o resultado. Diga só o que você precisa, sem instruções longas.

Exemplo prático. Você tem um chatbot de atendimento com um system prompt de 3.000 tokens. Metade é procedimental: "primeiro classifique a intenção, depois verifique a URL, faça X, depois faça Y". Essa sequência foi escrita porque o modelo antigo pulava verificações. Com o Mythos, você provavelmente vai deletar 40% desse prompt — o modelo já faz tudo isso por conta própria, frequentemente melhor do que você descreveu.

A pergunta para cada linha: é especificação de resultado ou tentativa de controlar processo? Mantenha a primeira, corte a segunda.

2. Repensar a arquitetura de retrieval e memória de contexto

Tem muito conteúdo por aí declarando que "RAG morreu". Eu não concordo com a forma como está sendo colocado. A questão é mais sutil.

O que vai mudar é quem decide o que entra no contexto.

Antes, você programava a lógica de retrieval: definia quantos documentos buscar, qual estratégia, qual base, com quais parâmetros. Com janelas de contexto de 1, 10 ou até 100 milhões de tokens (que estão chegando), o modelo vai ser progressivamente melhor em decidir sozinho o que precisa buscar e trazer para o contexto.

O seu trabalho muda de "programar a busca" para "organizar o repositório". Apresentar de forma clara o que está disponível, navegável, indexado por contexto humano-legível. E confiar que o modelo vai puxar o que precisa quando precisar.

Estimativa minha: 80% do trabalho de retrieval daqui pra frente vai ser organização das fontes, não engenharia de busca.

3. Conhecimento explícito vs. inferência do modelo

Pensa no seguinte cenário: você tem um relatório de cliente com estilo específico — tom, formalidade, estrutura, formatação, tamanho de letra, regras de negócio. Hoje, você lista todas essas regras explicitamente no prompt.

Com o Mythos, você joga um exemplo do output desejado e ele infere as regras automaticamente. Isso vale para regras de negócio também: um exemplo bem escolhido substitui dezenas de instruções procedurais.

Audite o que você manda repetidamente para o modelo. Cada instrução, cada lembrete, cada regra: pergunte "isso está aqui porque o modelo não consegue inferir, ou porque eu tenho medo de que ele não infira?" — medo não é uma boa razão para queimar tokens.

4. O skill mais demandado em 2026: avaliação de output

Esse é o ponto mais crítico — e o que estou falando há semanas tanto no canal quanto em posts no Instagram.

Empresas estão entregando features em uma semana que antes levavam um mês. Nós humanos não fomos feitos para trabalhar na velocidade que a IA tem capacidade de entregar. Como você verifica que o modelo realmente está fazendo o que deveria fazer?

Não é mais aceitável "ler o output e achar que tá ok". Quando o modelo gera milhares de linhas de código por dia, dezenas de queries, centenas de documentos — você precisa de um gate de avaliação automatizado, robusto e adversarial.

Nada mais é do que um conjunto de testes que verifica:

A pergunta que define se você confia ou não: "isto passou em todos os testes adversariais que eu conheço?" — não "isto parece bom?"

Esse skill — engenharia de avaliação de modelos de IA — é hoje o gargalo principal de qualquer operação séria com agentes. Empresas vão contratar pesado por isso nos próximos 12-18 meses.

O que eu recomendo fazer agora

Não espere o lançamento público. Use as próximas semanas para:

  1. Auditar os prompts dos seus sistemas de produção e identificar candidatos para enxugar
  2. Reorganizar suas fontes de retrieval — pense em legibilidade humana, não otimização de busca
  3. Trocar regras explícitas por exemplos sempre que possível
  4. Construir o seu pipeline de avaliação automatizada — esse é o investimento de maior alavancagem hoje

O Mythos vai chegar. Quando chegar, vai expor quem fez o dever de casa e quem não fez.


Este artigo foi gerado a partir do meu vídeo no YouTube. Assista a versão completa para a análise estendida e exemplos do meu próprio trabalho com modelagem de ameaças.

Prefere vídeo?

Assistir no YouTube

Posts relacionados