O GitHub anunciou nesta quinta-feira (23 de outubro de 2025) a adoção de um novo modelo personalizado para o Copilot, focado em ampliar a velocidade e a qualidade das autocompletarões de código apresentadas aos desenvolvedores.
Principais ganhos de desempenho
De acordo com a companhia, as melhorias já estão disponíveis em todos os editores e ambientes compatíveis com o assistente. Os resultados medidos pelos engenheiros indicam:
- 20% mais caracteres aceitos e mantidos no código final;
- 12% de aumento na taxa de aceitação das sugestões;
- triplo de throughput (tokens por segundo);
- redução de 35% na latência para exibir cada sugestão.
Mudança na forma de medir qualidade
Segundo o GitHub, as primeiras versões do Copilot priorizavam apenas a taxa de aceitação. No entanto, a equipe percebeu que esse foco excessivo incentivava ofertas curtas e simples, pouco úteis em cenários reais. Com o novo modelo, passaram a pesar também os “caracteres aceitos e retidos”, o fluxo de código e outras métricas para alinhar o assistente às necessidades práticas dos programadores.
Camadas de avaliação
O processo de validação combinou:
- testes offline em repositórios públicos e internos, com verificação de compilação e execução;
- avaliação de um LLM independente, que pontua qualidade, relevância e utilidade de cada sugestão;
- comparações lado a lado com desenvolvedores internos e parceiros, incluindo especialistas em linguagens para fins de refinamento.
Como o modelo foi treinado
Para construir a base, a empresa utilizou um corpus de quase 10 milhões de repositórios em mais de 600 linguagens, eliminando duplicações e priorizando código moderno. Após o mid-training, aplicou fine-tuning supervisionado e reforço por recompensas que analisam:
- qualidade sintática e aderência ao estilo do projeto;
- relevância ao contexto do arquivo;
- capacidade de reduzir esforço manual, privilegiando APIs atuais.
Um dos focos foi aprimorar a técnica “fill-in-the-middle” (FIM), evitando duplicações de prefixo, sobrescrita de sufixo e falhas de alinhamento do cursor, problemas comuns em modelos de uso geral.
Imagem: Internet
Próximos passos
Entre as frentes em andamento, o GitHub menciona a criação de versões específicas para domínios como motores de jogos, finanças e sistemas ERP, além do ajuste fino das funções de recompensa para refletir sucesso de compilação, utilidade sem excesso de código e preferência por bibliotecas idiomáticas e atuais.
Os responsáveis agradecem a comunidade de desenvolvedores pelo feedback contínuo e destacam a colaboração de pesquisadores, engenheiros, designers e gerentes de produto da Microsoft e do GitHub na evolução do Copilot.
Com informações de GitHub Blog