A Inception, startup que desenvolve modelos de inteligência artificial baseados em difusão, arrecadou US$ 50 milhões em rodada seed liderada pela Menlo Ventures. Os investidores-anjo Andrew Ng e Andrej Karpathy também participaram do aporte.
O projeto é comandado pelo professor da Universidade de Stanford Stefano Ermon, pesquisador que estuda modelos de difusão — técnica que gera saídas por refinamento iterativo, em vez de prever palavra por palavra. Esse tipo de arquitetura já impulsiona sistemas de imagem como Stable Diffusion, Midjourney e Sora. Agora, a Inception quer expandir o conceito para outras tarefas, incluindo processamento de texto e desenvolvimento de software.
Novo modelo Mercury focado em desenvolvimento
Junto com o anúncio do investimento, a empresa lançou uma nova versão do Mercury, modelo projetado para auxiliar na criação de software. A solução já está integrada a ferramentas como ProxyAI, Buildglare e Kilo Code.
Segundo Ermon, a abordagem por difusão permite reduzir dois fatores críticos: latência e custo computacional. “Esses LLMs de difusão são muito mais rápidos e eficientes do que tudo o que está sendo construído hoje”, afirmou o pesquisador.
Difusão versus auto-regressão
Modelos auto-regressivos, como GPT-5 e Gemini, geram texto de forma sequencial, prevendo cada próxima palavra com base no histórico. Já os modelos de difusão atuam de maneira holística, ajustando gradualmente toda a estrutura da resposta até atingir o resultado desejado.
Imagem: Internet
Pesquisas recentes indicam que a difusão pode oferecer desempenho superior em grandes volumes de texto ou sob restrições de dados, vantagem que se torna evidente ao lidar com extensos repositórios de código, ressalta Ermon.
Outra diferença é o aproveitamento de hardware: enquanto modelos auto-regressivos executam operações em série, os de difusão conseguem processar múltiplas operações em paralelo, resultando em latência significativamente menor. De acordo com o fundador, o Mercury já foi benchmarkado em mais de 1.000 tokens por segundo, índice considerado inviável para tecnologias auto-regressivas.
Com informações de TechCrunch