OpenAI apresenta Aardvark, agente baseado em GPT-5 que detecta e corrige falhas de código

A OpenAI anunciou o Aardvark, um agente autônomo alimentado pelo modelo GPT-5 e destinado a localizar e reparar vulnerabilidades em repositórios de código. A ferramenta, descrita pela empresa como um “pesquisador de segurança agentivo”, está disponível em beta privado.

Como funciona

Integrado ao fluxo de desenvolvimento, o Aardvark monitora commits e alterações no código, cria modelos de ameaça para cada projeto e usa raciocínio do LLM para apontar falhas, avaliar se podem ser exploradas e sugerir correções. Quando detecta um possível defeito, o agente tenta explorá-lo em um ambiente isolado; se a exploração for bem-sucedida, aciona o OpenAI Codex para gerar um patch que depois é revisado por um analista humano.

Base no GPT-5

O GPT-5, introduzido pela OpenAI em agosto de 2025, oferece capacidade de raciocínio mais profunda e um “roteador em tempo real” que escolhe o melhor modelo conforme o tipo de conversa, a complexidade e a intenção do usuário. Esses recursos também sustentam o Aardvark.

Resultados iniciais

Segundo a OpenAI, o agente já foi usado em repositórios internos da companhia e de parceiros alfa, identificando pelo menos 10 CVEs em projetos de código aberto.

Cenário competitivo

Empresas como o Google também testam ferramentas semelhantes. No início do mês, a gigante de Mountain View apresentou o CodeMender, sistema que detecta, corrige e reescreve trechos vulneráveis para prevenir explorações futuras.

Para a OpenAI, soluções como Aardvark pretendem oferecer análise contínua de código, validação de exploits e geração de patches, reforçando a segurança sem atrasar o desenvolvimento.

Com informações de The Hacker News

Rolar para cima