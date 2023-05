Da Redação, com assessoria

Após um teste conduzido no ChatGPT, a plataforma de e-learning Preply concluiu que o bot que virou sucesso mundial consegue reconhecer muitas das principais gírias e regionalismos brasileiros, mas ainda superestima sua própria capacidade de entendê-las. Isso porque, ao ser apresentada a um conjunto de 100 jargões típicos de todas as regiões do País, a ferramenta deu um significado alternativo — não necessariamente incorreto, mas diferente de seu sentido mais comum — a 19% das expressões testadas.

Entre os termos mal explicados, está “queixar”. Ao contrário do que parece, quer dizer “flertar” ou “chamar para sair” no vocabulário popular baiano. A tecnologia criada pelo estadunidense Sam Altman, no entanto, se rendeu inicialmente ao significado padrão usado para quando alguém expõe aborrecimento.

Algo similar também aconteceu com o significado de “peidado”, termo bastante utilizado em Alagoas, quando a ferramenta afirmou se tratar de uma pessoa muito bêbada. O sentido proposto, tal como o anterior, foi de encontro ao seu uso mais conhecido na região. Na verdade, a expressão é comumente evocada pelos alagoanos para descrever alguém que está indignado ou furioso.

De forma curiosa, quando realmente foi indagado sobre uma gíria usada para nomear quem passou do ponto na bebida – a expressão baiana “cheio de pau” –, o chat disse que esta se referia a uma pessoa que inventa desculpas ou que está à flor da pele.

Para a maioria das palavras, contudo, bastou ser questionado “qual o significado da gíria x?” que o bot retornou uma resposta satisfatória. Em outros casos, foi necessário fornecer um pouco mais de contexto, como de que Estado a palavra deriva ou em qual é mais utilizada. Em situações como essas, duas ou três perguntas complementares foram suficientes.

Como o ChatGPT chegou aos significados de gírias e regionalismos?

A resposta para esta pergunta foi consultada na própria ferramenta, que compartilhou ter sido treinada com uma grande quantidade de textos e dados de linguagem natural para captar múltiplos diálogos e contextos.

Na verdade, é de conhecimento geral que os dados que constroem o chat vêm de livros, artigos de notícias, páginas da web, mídias sociais e fontes afins, algo que o permite entender e reconhecer muitas palavras comuns em diferentes contextos, incluindo gírias e regionalismos, além de expressões informais.

Logo, quando alguém pergunta sobre o significado de uma gíria, ele rapidamente recorre ao conhecimento adquirido por meio do seu “treinamento” para responder. Em último caso, há uma espécie de nova varredura em fontes confiáveis como dicionários, enciclopédias e outras referências online.

Vale lembrar que a tecnologia criada pelo laboratório de pesquisa estadunidense OpenAI é semelhante à de assistentes virtuais como a Alexa, da Amazon, e o Google Assistant. Segundo o site da organização, seu desenvolvimento é pautado em redes neurais e machine learning com foco em diálogos virtuais.

Entretanto, é importante ressaltar que, por ser uma inteligência artificial, o chat está passível de cometer erros, como demonstrou a pesquisa da Preply. “Embora eu possa entender muitas gírias e expressões informais, minha capacidade de processar linguagem natural é limitada em relação à de um ser humano. Isso significa que posso não entender totalmente certas nuances culturais importantes para interpretar adequadamente a gíria”, respondeu o ChatGPT após ser questionado sobre sua assertividade.

As palavras desconhecidas

Durante o experimento, a ferramenta afirmou “não saber” com menos frequência do que forneceu respostas tidas como “alternativas” a seus usuários. Apenas três palavras entre as 100 não foram reconhecidas por ela ao longo da ocasião: “olada”, “moage” e “despombalecido”.

A primeira é originária do Rio Grande do Sul e, de modo geral, significa ocasião oportuna. Quando alguém está com muita sorte em jogos, por exemplo, diz-se que está “de olada”. Já “moage” não tem uma origem específica, mas é popularmente conhecida para chamar pessoas que estão de enrolação ou criando complicações. “Deixa de moage e vamos trabalhar”, é possível dizer para quem está fazendo “corpo mole”. Por fim, a gíria paraense “despombalecido” serve para se referir ao sujeito que está triste, com preguiça ou doente.

“Nosso estudo sugere que dois tipos de gírias e regionalismos parecem suscitar imprecisões no ChatGPT: os que exigem um pouco mais de contexto e aqueles derivados de palavras formais da língua, ressignificadas depois em alguns locais”, avalia Yolanda Del Peso, especialista em outreach da Preply. “Isso nos ajuda a pensar até onde a tecnologia é capaz de ir, bem como certas nuances da linguagem que ela ainda não alcança – e nem tão cedo será capaz de alcançar”, completa.