Principais conclusões
- O Google está supostamente trabalhando para trazer suporte ao Gemini Live para consultas ‘Pergunte sobre este vídeo’ no Youtube.
- Com o suporte do Gemini Live, os usuários poderão fazer perguntas sobre os vídeos do YouTube e obter respostas de forma natural e coloquial.
- Este recurso ainda está em fase de desenvolvimento e não está claro se substituirá completamente a opção tradicional de resposta de texto.
No início deste ano, em maio, na conferência anual de desenvolvedores I/O do Google, a gigante da tecnologia exibiu uma nova adição interessante ao seu conjunto de recursos para Gemini em smartphones. Um desses recursos, ‘Pergunte sobre esta tela’ e/ou ‘Pergunte sobre este vídeo’, foi disponibilizado em agosto – permitindo que a ferramenta de IA ganhasse habilidades contextuais na tela.
Isso não apenas permitiu que a ferramenta entendesse o que está acontecendo na tela do seu dispositivo, mas também permitiu que os usuários investigassem a ferramenta de IA sobre isso.
Relacionado
O Google Gemini finalmente permite ‘perguntar sobre esta tela’ e resumir os vídeos do YouTube
Você pode experimentar o recurso de assistente hoje
Outro recurso importante do Gemini revelado pela primeira vez no I/O é o Gemini Live. A ferramenta, que fica dentro do aplicativo Gemini (que chegou recentemente ao iOS), é um assistente de IA conversacional com recursos de diálogo falado com som natural. Agora, parece que as habilidades contextuais na tela ‘Pergunte sobre’ do Gemini e o Gemini Live estão se unindo.
Conforme destacado pela Autoridade Android, o Google pode estar trabalhando para oferecer suporte ao Gemini Live para consultas ‘Pergunte sobre este vídeo’. Para referência, atualmente, quando você pergunta ao Gemini sobre um vídeo do YouTube, é apresentado um bloco de texto como resposta da ferramenta. Você pode, é claro, ouvir a resposta de Gêmeos, mas isso não é exatamente uma “conversa”.
Sem cronograma de lançamento por enquanto
O código localizado na versão 15.46.31.ve.arm64 beta do Google app, no entanto, indica que os usuários provavelmente poderão em breve entrar no ‘modo de conversa’ ao tocar no chip Pergunte sobre este vídeo.
O modo conversação, conforme sugerido no código, está vinculado ao Gemini Live, que deve permitir aos usuários interromper o assistente, fazer perguntas de acompanhamento e, em geral, fazer com que a ferramenta de IA responda às suas dúvidas de forma mais coloquial. “Antes de entrar ao vivo, aumente o volume do seu dispositivo para poder ouvir o Gemini”, diz uma string.
É importante notar que a funcionalidade só foi identificada no código e atualmente não há capturas de tela de sua implementação. Portanto, se isso se concretizar, não está claro se o Gemini Live substituirá completamente a experiência tradicional Pergunte sobre esta experiência de vídeo ou se o Google oferecerá ambas as opções.