Resumo
- Um dos maiores projetos de IA do Google, de codinome Gemini, está enfrentando desafios e seu lançamento foi adiado devido à necessidade de melhorias nas capacidades multilíngues.
- O atraso no lançamento do Gemini impactará outros produtos do Google, como o Bard, que deveriam se beneficiar dele.
- O Google pretende superar as capacidades do ChatGPT da OpenAI com Gemini, combinando grandes modelos de linguagem e geração de imagens de IA para criar uma ferramenta versátil. O projeto deverá ser concluído, no mínimo, em 2024.
Quando o ChatGPT da OpenAI conquistou o mundo há cerca de um ano, soou o alarme em toda a indústria de tecnologia. As empresas que ainda não estavam totalmente apostadas na IA sabiam que precisavam acelerar, e uma delas era o Google. Desde então, a gigante da tecnologia lançou o Google Bard e adicionou inúmeras ferramentas de IA a vários serviços, ao mesmo tempo que trabalhava em seu próprio projeto de IA abrangente para rivalizar com os mais recentes avanços GPT da OpenAI, codinome Gemini. Embora tenha sido originalmente especulado que o Gemini poderia entrar no ar antes do final de 2023, agora parece que o projeto encontrou um obstáculo.
De acordo com The Information, fontes próximas ao projeto Gemini afirmam agora que o CEO do Google, Sundar Pichai, freou os próximos eventos de lançamento. Embora edições menores do Gemini já tenham sido testadas, o modelo de linguagem grande ainda está sendo desenvolvido e supostamente enfrenta desafios. Especificamente, os engenheiros acreditam que o multilinguismo precisa de mais melhorias antes que o Gemini possa ser lançado – embora tenha um bom desempenho em inglês, o seu desempenho está atrasado em outras línguas.
Se um atraso for iminente, isso significa que outros produtos e serviços do Google que deveriam se beneficiar do Gemini (como o Bard) também serão afetados. Quando for lançado, o Gemini deverá vir em diferentes tamanhos, incluindo uma versão leve para celular. A ideia seria atrair o maior número possível de desenvolvedores.
Quando detalhes sobre o projeto Gemini começaram a vazar, rumores sugeriram que o Google não queria que ele se equiparasse ao ChatGPT – fontes internas alegaram que o objetivo era superar as capacidades do produto OpenAI. O desenvolvimento tem se concentrado na combinação dos recursos de texto de grandes modelos de linguagem e na geração de imagens de IA para criar uma ferramenta mais versátil. O Google supostamente tem usado transcrições de vídeos do YouTube para treinar Gemini, e os advogados da empresa têm monitorado o processo para garantir que os materiais de treinamento não violem as regulamentações de direitos autorais.
Para reforçar seus esforços, o Google deu as boas-vindas ao seu cofundador Sergey Brin para adotar uma abordagem prática aos esforços de IA da empresa e ajudar a liderar a Gemini. Outros notáveis que embarcaram incluem Paul Barham, pesquisador sênior do Google, e Tom Hennigan, da DeepMind. Quando o Gemini estiver completo, ele poderá ser usado para alimentar o conjunto de produtos do Google, do Bard ao Duet AI do Workspace.
De acordo com fontes internas, a primeira estreia de Gêmeos será em 2024, mas nada foi definido em pedra. Enquanto isso, a OpenAI já está trabalhando para superar seu modelo GPT-4 e desenvolver o GPT-5. Quando o Gemini for lançado, será interessante ver se ele ainda pode ajudar o Google a ganhar terreno no OpenAI. Embora o potencial certamente exista, o atraso pode ser um revés caro se o concorrente do Google usar o tempo extra a seu favor.