Google lança Gemini 2.0 com novos poderes de imagem e áudio para a era dos agentes de IA

Este artigo cobre uma história em desenvolvimento. Continue nos consultando, pois adicionaremos mais informações assim que estiverem disponíveis.

A IA generativa foi o foco de todas as empresas de tecnologia em 2023 graças ao seu potencial inegável – mas à medida que o calendário avançava para 2024, a estagnação se instalou e as coisas tornaram-se mais iterativas. Quando o Google lançou Gêmeos 1.0 há quase exatamente um ano, a IA multimodal era seu foco principal, permitindo entrada e saída por meio de diversas formas de mídia. Agora, à medida que o potencial dos agentes de IA injeta nova vida na cena, o Gemini 2.0 chegou para ligar alguns pontos entre esse passado multimodal e o futuro dos agentes.

dois telefones executando o aplicativo Google Gemini e Gemini ao vivo em um teclado de laptop

Relacionado

Google Gemini: tudo o que você precisa saber sobre a IA multimodal de última geração do Google

O Google Gemini está aqui, com uma abordagem totalmente nova para IA multimodal

O Google anunciou hoje o Gemini 2.0 em seu blog, com prefácio do CEO Sundar Pichai (via The Verge). As principais mudanças são recursos nativos de imagem e áudio e acesso integrado a ferramentas externas como a Pesquisa Google, mas há muito mais acontecendo nos bastidores.

Este artigo cobre uma história em desenvolvimento. Continue nos consultando, pois adicionaremos mais informações assim que estiverem disponíveis.

Google Gemini: tudo o que você precisa saber sobre a IA multimodal de última geração do Google

Posts relacionados

Esta pulseira Pixel Watch ideal para exercícios perde a exclusividade da Google Store

Afinal, o que é um telefone carro-chefe?

As 7 maiores mudanças na plataforma de streaming de vídeo em 2024