Você já tentou “conversar” com um banco de dados em português?

Uma pesquisa apresentada na PROPOR 2026 analisou o desempenho de grandes modelos de linguagem na conversão de perguntas em português para SQL. Os resultados mostram que ferramentas como Claude, Gemini, DeepSeek e Qwen apresentam queda de precisão em comparação ao inglês. O estudo também identificou que modelos com capacidade de raciocínio continuam processando informações internamente em inglês, o que pode gerar erros. A pesquisa destaca os desafios para tornar a inteligência artificial verdadeiramente multilíngue em aplicações técnicas e de análise de dados.

Compartilhe
Ilustração comparando a criação manual de consultas SQL com o uso de inteligência artificial para acessar bancos de dados em português. À esquerda, um desenvolvedor escreve comandos SQL diretamente em um computador. À direita, um assistente de IA recebe perguntas em linguagem natural, como consultas sobre vendas, alunos e clientes, e as converte em consultas para banco de dados, destacando os desafios da tradução e do raciocínio multilíngue em sistemas de IA.

Estudo revela que IAs como Claude, Gemini e DeepSeek perdem precisão ao converter perguntas em português para SQL, expondo desafios multilíngues.

Os Grandes Modelos de Linguagem (LLMs) conseguem transformar perguntas feitas em linguagem natural em códigos SQL (a linguagem dos bancos de dados). Isso é incrível porque permite que qualquer pessoa, mesmo sem saber programar, consiga extrair informações valiosas de sistemas complexos.

Mas tem um detalhe: a maioria dessas IAs foi treinada focando no inglês. O que acontece quando pedimos para elas fazerem isso em português?

Nosso estudo recente testou várias IAs de ponta (como Claude, Gemini, DeepSeek e Qwen) nessa tarefa. Os principais achados foram surpreendentes:

1️⃣ Caiu o rendimento: Todas as IAs testadas tiveram uma queda de precisão quando a pergunta foi feita em português. Algumas caíram pouco (como o Gemini 2.5 Pro e o Claude 4.5 Sonnet), mas outras despencaram.

2️⃣ Pensando em inglês: Mesmo quando a pergunta e os dados estavam em português, as IAs que possuem “modo de raciocínio” (thinking mode) continuaram pensando internamente em inglês! Isso gera um ruído na tradução mental da máquina e causa erros.
3️⃣ Raciocinar não basta: Apenas ligar o “modo de raciocínio” da IA não resolveu o problema. O que realmente ajudou foi dar à IA um plano guiado (um passo a passo de como montar a consulta).

O que isso significa para nós? Ainda temos um longo caminho para tornar a IA verdadeiramente multilíngue em tarefas complexas e técnicas. Precisamos de mais pesquisas e adaptações focadas no nosso idioma para que as ferramentas de dados sejam acessíveis a todos os brasileiros, sem barreiras linguísticas!

🔗 Quer saber mais? O artigo completo “Language Effects in Text-to-SQL Across English and Portuguese” foi publicado por mim e meus colegas de pesquisa Lucas Nobre, Suele Sousa e Savio Teles no International Conference on Computational Processing of Portuguese (PROPOR 2026), o principal evento científico para o tema de processamento de linguagem natural para língua portuguesa.
Link nos comentários.

Pro. Anderson Soares

Pro. Anderson Soares

Fundador e Vice Presidente de Tecnologia do Centro de Excelência em Inteligência Artificial (CEIA)

Ver mais artigos desse autor

Recomendadas para você

Essa bolha da IA não vai estourar nunca?

Essa bolha da IA não vai estourar nunca?

Estudos da BCG e Mercer revelam desalinhamentos entre conselhos, CEOs e lideranças na adoção da IA. O excesso de expectativas, a falta de conhecimento sobre a tecnologia e desafios de cultura organizacional podem comprometer a transformação digital nas empresas.

Henrique de Castro
01 DE JUNHO
Background newsletter

Inscreva-se na nossa newslleter