A OpenAI anunciou o Aardvark, um agente autônomo alimentado pelo modelo GPT-5 e destinado a localizar e reparar vulnerabilidades em repositórios de código. A ferramenta, descrita pela empresa como um “pesquisador de segurança agentivo”, está disponível em beta privado.
Como funciona
Integrado ao fluxo de desenvolvimento, o Aardvark monitora commits e alterações no código, cria modelos de ameaça para cada projeto e usa raciocínio do LLM para apontar falhas, avaliar se podem ser exploradas e sugerir correções. Quando detecta um possível defeito, o agente tenta explorá-lo em um ambiente isolado; se a exploração for bem-sucedida, aciona o OpenAI Codex para gerar um patch que depois é revisado por um analista humano.
Base no GPT-5
O GPT-5, introduzido pela OpenAI em agosto de 2025, oferece capacidade de raciocínio mais profunda e um “roteador em tempo real” que escolhe o melhor modelo conforme o tipo de conversa, a complexidade e a intenção do usuário. Esses recursos também sustentam o Aardvark.
Resultados iniciais
Segundo a OpenAI, o agente já foi usado em repositórios internos da companhia e de parceiros alfa, identificando pelo menos 10 CVEs em projetos de código aberto.
Cenário competitivo
Empresas como o Google também testam ferramentas semelhantes. No início do mês, a gigante de Mountain View apresentou o CodeMender, sistema que detecta, corrige e reescreve trechos vulneráveis para prevenir explorações futuras.
Imagem: Internet
Para a OpenAI, soluções como Aardvark pretendem oferecer análise contínua de código, validação de exploits e geração de patches, reforçando a segurança sem atrasar o desenvolvimento.
Com informações de The Hacker News