Prosodia é uma iniciativa brasileira de pesquisa em inteligência artificial dedicada ao desenvolvimento de modelos de linguagem e datasets abertos para o português.
O português é uma das línguas mais faladas do mundo, porém permanece sub-representado nos sistemas modernos de IA. O Prosodia existe para reduzir essa lacuna, criando modelos fundacionais, datasets curados e benchmarks de avaliação que refletem a diversidade linguística e cultural das comunidades lusófonas.
Trabalhamos com pré-treinamento e fine-tuning de LLMs otimizados para português brasileiro e europeu, infraestrutura de tradução EN-PT de alta vazão para localização de datasets, suítes de avaliação de NLU/NLG em português (ASSIN, BLUEX, OAB, ENEM, HateBR, entre outros), e curadoria de corpora de larga escala para pré-treinamento e instruction tuning.
Nosso trabalho enfatiza métodos práticos e reproduzíveis, incluindo pruning e destilação de modelos para arquiteturas eficientes, inferência de alto desempenho, e pipelines robustos para tradução e filtragem de bilhões de tokens.
Acesse prosodia.org para documentação técnica completa.
© 2025 Prosodia. Todos os direitos reservados.