Andrej Karpathy, cofundador da OpenAI e ex-diretor de inteligência artificial da Tesla, declarou que os agentes de IA — programas capazes de executar tarefas de forma autônoma — ainda não atingem o nível de desempenho esperado. A afirmação foi feita durante participação no Dwarkesh Podcast.
“Eles simplesmente não funcionam”
Segundo Karpathy, as ferramentas disponíveis hoje carecem de inteligência suficiente, recursos multimodais e aprendizado contínuo. “Eles são cognitivamente deficientes e simplesmente não estão funcionando”, disse, estimando que a solução para essas limitações pode levar cerca de dez anos.
Expectativa do mercado contrasta com a realidade
No Vale do Silício, investidores preveem 2025 como “o ano do agente”, apostando que esses sistemas serão capazes de agendar viagens, gerenciar e-mails ou desenvolver software com mínima intervenção humana. Entretanto, Karpathy avaliou que o setor aposta em um futuro onde entidades totalmente autônomas colaboram em paralelo, tornando os humanos desnecessários.
Um exemplo das dificuldades atuais foi descrito por Quintin Au, líder de crescimento da ScaleAI. De acordo com ele, se um modelo de linguagem acerta 80% de cada etapa, a probabilidade de concluir uma tarefa de cinco passos com sucesso cai para 32%, pois erros se acumulam a cada fase.
Defesa da colaboração homem-máquina
Após o podcast, o executivo reforçou no X/Twitter que defende a atuação conjunta entre pessoas e máquinas. “Quero que a IA puxe a documentação da API e me mostre que utilizou tudo corretamente. Quero que ela colabore comigo quando não tiver certeza”, escreveu.
Para Karpathy, insistir em agentes totalmente autônomos pode ampliar a produção de AI slop — conteúdo de baixa qualidade gerado por inteligência artificial — já comum nas redes sociais.
Imagem: reprodução
Vibe coding tem avanços, mas ainda enfrenta limites
O engenheiro popularizou o termo vibe coding, método em que o desenvolvedor descreve em linguagem natural o que deseja e a IA produz o código. Ele relatou usar ferramentas como Composer (Cursor AI) e o modelo Sonnet (Anthropic) para criar aplicações. Ainda assim, admitiu não ter conseguido programar seu projeto Nanochat apenas com agentes, optando por escrever o código à mão.
Karpathy pontuou que esse tipo de geração automática pode se tornar difícil de controlar em projetos complexos e abrir brechas de segurança.
Com informações de Tecnoblog