Google lança Gemini 2.0 com novos poderes de imagem e áudio para a era dos agentes de IA

Este artigo cobre uma história em desenvolvimento. Continue nos consultando, pois adicionaremos mais informações assim que estiverem disponíveis.

A IA generativa foi o foco de todas as empresas de tecnologia em 2023 graças ao seu potencial inegável – mas à medida que o calendário avançava para 2024, a estagnação se instalou e as coisas tornaram-se mais iterativas. Quando o Google lançou Gêmeos 1.0 há quase exatamente um ano, a IA multimodal era seu foco principal, permitindo entrada e saída por meio de diversas formas de mídia. Agora, à medida que o potencial dos agentes de IA injeta nova vida na cena, o Gemini 2.0 chegou para ligar alguns pontos entre esse passado multimodal e o futuro dos agentes.



Relacionado

Google Gemini: tudo o que você precisa saber sobre a IA multimodal de última geração do Google

O Google Gemini está aqui, com uma abordagem totalmente nova para IA multimodal

O Google anunciou hoje o Gemini 2.0 em seu blog, com prefácio do CEO Sundar Pichai (via The Verge). As principais mudanças são recursos nativos de imagem e áudio e acesso integrado a ferramentas externas como a Pesquisa Google, mas há muito mais acontecendo nos bastidores.



Este artigo cobre uma história em desenvolvimento. Continue nos consultando, pois adicionaremos mais informações assim que estiverem disponíveis.