Resumo
- O Google Gemini aprimorou recursos em desenvolvimento.
- O ‘Gemini Live’ poderá em breve permitir a interação de voz para IA com arquivos enviados e vídeos do YouTube.
- A interação com arquivos carregados pelo usuário pode simplificar o resumo e a interpretação do conteúdo do arquivo.
Gemini se tornou muito mais do que um substituto do Google Assistant no Android, embora a funcionalidade ainda não esteja à altura. Enquanto isso, o Google desenvolveu novos recursos para o Gemini, incluindo aqueles que o tornam adequado para o Android XR. Um dos lançamentos mais recentes de agosto do ano passado é chamado Gemini Live, destinado a imitar uma conversa falada natural com a IA. Em breve, o Google poderá aumentar essa experiência para onze com suporte para upload de documentos.
Relacionado
O que é o Gemini Live do Google?
O novo assistente de voz do Google
Para contextualizar, o upload de documentos já é compatível com assinantes do Gemini Advanced, mas ainda requer consultas digitadas e respostas que você lê. Depois de analisados, você pode consultar a IA sobre os principais pontos de dados nos arquivos, obter um resumo rápido ou fazer inferências a partir das informações neles contidas. O Gemini Live transforma a experiência do usuário com consultas de voz e respostas faladas, mas ainda carece da capacidade de interagir com os arquivos enviados pelo usuário.
Esse elemento-chave poderá mudar em breve. O popular pesquisador de aplicativos do Google @AssembleDebug on X disse ao Android Authority que a versão beta 16.1.38 do Google app tem uma interface de usuário inteira dedicada ao manuseio de documentos. O pesquisador conseguiu ativar essa interface oculta, revelando suporte para upload de arquivos e suporte para obtenção de análises e respostas contextuais semelhantes no formato conversacional.
Interagir com o YouTube nunca mais será o mesmo
Resumos, agora lidos em voz alta
A interação começa no Gemini Advanced, onde os usuários podem fazer upload dos arquivos, mas uma vez feito isso, os usuários verão uma mensagem de brinde solicitando que eles mudem e “Fale ao vivo sobre isso”. No Live, a IA mantém acesso aos documentos e seus conteúdos. Também deve funcionar com vídeos do YouTube, onde você compartilha o link como faria com um amigo, e a IA digere seu conteúdo para cuspir uma análise, conclusão ou iniciar uma conversa completa sobre o assunto.
Como sempre, você também pode proteger uma transcrição de sua conversa com a IA para referência posterior, para que não precise ter a conversa inteira novamente. Embora isso possa não parecer uma grande melhoria, é o mais próximo que a IA nos trouxe de literalmente falar com um documento digital. Quando usado até mesmo para diversão, o tom casual das respostas do Gemini Live pode torná-las mais fáceis de processar ou lembrar.
Dito isto, a análise de documentos e vídeos do YouTube ainda não está disponível no Gemini Live e talvez tenhamos que esperar por um anúncio oficial de uma atualização do lado do servidor para desbloquear esse recurso para todos.