O Google Tradutor está obtendo sua maior expansão linguística até agora

Resumo

  • O Google Translate adicionou 110 novos idiomas, abrangendo cerca de 614 milhões de falantes, tornando-se a maior expansão linguística do aplicativo até agora.
  • Esta é uma extensão da Iniciativa 1.000 Idiomas do Google Tradutor, anunciada no final de 2022.
  • Alguns idiomas recentemente suportados incluem Afar, Cantonês, Manx, Nko, Punjabi (Shahmukhi), Tamazight (Amazigh) e Tok Pisin.




Graças a excelentes ferramentas de tradução como o Google Translate, as barreiras linguísticas estão rapidamente a tornar-se uma coisa do passado. A empresa anunciou o Iniciativa 1.000 Idiomas no final de 2022, com o objetivo de apoiar as mil línguas mais faladas no mundo usando inteligência artificial. O Google Translate está agora dando mais um grande passo em direção a esse objetivo, com a equipe anunciando a inclusão de 110 novos idiomas abrangendo vários continentes e vários países.

Relacionado

O que é o Google PaLM 2?

O PaLM 2 LLM do Google está alimentando Bard, Google Assistant e muito mais: aqui está o que está acontecendo


O Google chama isso de “a maior expansão de todos os tempos” do serviço, com o modelo de linguagem grande (LLM) PaLM 2 desempenhando um papel importante em trazer esses idiomas para desktop e aplicativos móveis. Esta expansão abrange cerca de 614 milhões de falantes em todo o mundo, com cerca de um quarto das línguas recentemente incluídas provenientes do continente africano.

Alguns dos idiomas suportados por esta expansão incluem Longe, Cantonês, Manx, Nko, Punjabi (Shahmukhi), Tamazight (Amazigh)e Tok Pisin. Embora o Google não tenha fornecido uma lista completa dos idiomas recém-adicionados, uma página de suporte da empresa publicou a lista atualizada.

O Google diz que algumas dessas línguas quase não têm falantes nativos, enquanto outras têm até 100 milhões de falantes. Usando a língua Manx como exemplo, o Google explica como ela estava à beira da extinção há algumas décadas, mas agora tem milhares de falantes devido aos esforços subsequentes de renascimento. Enquanto isso, os falantes de inglês são incentivados a verificar o idioma Tok Pisin no Google Translate, um idioma crioulo baseado em inglês usado em Papua Nova Guiné, que aparentemente contém algumas palavras familiares.



Identificar novos idiomas é um processo complexo

Uma demonstração do Google Tradutor mostrando traduções em vários novos idiomas

O Google reconhece os desafios de identificar e oferecer suporte a novos idiomas, pois eles podem variar com base em vários fatores, como dialetos ou ortografia. Dadas essas complexidades, o Google diz que escolhe as variedades linguísticas comuns que estão em uso, ao mesmo tempo que adota outros elementos de uma língua ou dialeto relacionado.

As coisas ficam um pouco mais complicadas quando duas línguas são bastante semelhantes. O Google fala sobre o crioulo seichelense e o crioulo maurício, que são línguas crioulas de base francesa, ao mesmo tempo que cita o awadhi e o marwadi, que estão relacionados ao hindi. Todos esses idiomas estão agora disponíveis como parte desta expansão.


A equipe do Translate dá créditos ao PaLM 2 LLM por lançar alguns desses idiomas, ao mesmo tempo em que promete trabalhar com falantes nativos e especialistas em linguística para oferecer suporte a ainda mais idiomas e suas variações no futuro. Ainda não consigo encontrar os idiomas recém-incluídos no Google Translate para a web e no aplicativo Android, mas isso não deve demorar muito para mudar.