Nova pesquisa de vídeo do Google Lens disponível agora

Principais conclusões

  • O Google Lens agora oferece suporte à pesquisa de vídeos para participantes do Search Labs.
  • Você pode gravar vídeos e fazer perguntas, mas a precisão das respostas pode variar.
  • O gerente de produto do Google Lens diz que os diferentes produtos de busca visual do Google são distintos porque as pessoas os usam para coisas diferentes.




Em junho, tivemos nosso primeiro vislumbre da próxima funcionalidade do Google Lens que permite pesquisar não apenas usando fotos, mas também vídeos. Então, no início desta semana, alguns usuários tiveram acesso a essa nova opção com muito pouco alarde – o detetive Android Mishaal Rahman deu a notícia em seu canal Telegram, e alguns de nós aqui na AP descobrimos que poderíamos usar o Lens para pesquisa de vídeos logo depois.

Hoje, o Google finalmente anuncia oficialmente o recurso. Embora o anúncio do Google não contenha muitas informações novas sobre a pesquisa de vídeos em si, ele revela como acessá-la: a pesquisa de vídeos no Google Lens é atualmente um recurso exclusivo do Search Labs. Se você está curioso para experimentar a pesquisa de vídeos, mas ainda não está inscrito, é fácil entrar.



Novos recursos de lentes multimodais são oficiais

Para usuários inscritos no Search Labs Visão geral de IA e muito mais Experimente, pesquisar vídeo no Lens é muito simples: toque no ícone do Lens na barra de pesquisa do Google, aponte a câmera para o que deseja perguntar e pressione e segure o botão do obturador. Durante a gravação, você pode fazer perguntas sobre o assunto do vídeo. O Google tentará analisar o vídeo e sua pergunta sobre ele e, em seguida, fornecer um resumo da resposta com tecnologia de IA.

Pesquisa de vídeo do Google Lens com voz MR-anim

Fonte: Mishaal Rahman

O processo é surpreendentemente rápido, mas nem sempre totalmente preciso; no exemplo de Mishaal acima, o relógio que ele digitalizou no Lens era na verdade um OnePlus Watch 2, mas o Lens o identificou como um OnePlus Watch 2R. No entanto, esse é um erro fácil de cometer; os dois relógios são muito semelhantes.


Se você não for participante do Search Labs, pressionar e segurar o botão do obturador não gravará um vídeo, mas sim tirará uma foto e gravará o áudio enquanto seu dedo é pressionado para que você possa fazer perguntas em voz alta. O resultado final é semelhante: você obterá uma resposta gerada por IA para sua pergunta.

Como se inscrever no Search Labs

Para aproveitar os novos recursos de vídeo do Lens, você precisará se inscrever no Search Labs e, em seguida, ativar o Visão geral de IA e muito mais experimentar. A nova opção de vídeo Lens está disponível no Google app para Android e iOS.

Google demonstrou funcionalidade multimodal no Gemini no I/O

google-io-shoreline-2024-gemini-bot

O Google exibiu alguns recursos de vídeo multimodal do Gemini no I/O no início deste ano. Embora esse novo recurso do Lens tenha um escopo muito mais limitado do que as amplas demonstrações do Project Astra que experimentei, ainda parece que os esforços de pesquisa visual do Google – no Lens, Circle to Search e Gemini – têm muita sobreposição.


Perguntei ao gerente de produto do Lens, Harsh Kharbanda, sobre essa aparente redundância no início desta semana, e ele disse que os vários produtos de busca visual do Google são distintos em grande parte devido às diferentes maneiras como as pessoas tendem a usá-los.

“As pessoas usam esses produtos de busca visual de maneiras diferentes e têm modelos mentais ligeiramente diferentes”, disse-me Kharbanda. “Então, para (Lens), geralmente as pessoas fazem perguntas sobre as coisas que estão na frente delas. Uma planta que está morrendo, uma moeda que encontraram em casa, e elas ficam tipo, ei, quanto vale isso e assim por diante. Para Circule para Pesquisar, quase todas as perguntas são sobre coisas na sua tela. Um influenciador do Instagram está usando uma mochila nova e você está tipo, ei, eu quero saber mais sobre isso.


“E, de fato, em Gêmeos, muitas das questões são mais sobre colaboração criativa. Você sabe, como minhas outras obras de arte, meu filho pode fazer?” Kharbanda continuou. “E então eu acho que neste ponto, a maneira como os usuários estão usando esses produtos é distinta o suficiente, que faz sentido para as pessoas realmente terem esses diferentes pontos de entrada e produtos diferentes em toda a sua jornada e em seus telefones.”