O Google Recorder corrigiu seu maior problema com resumos de IA, mas há um porém

Resumo

  • Os investimentos em IA do Google são promissores com ferramentas como o aplicativo Pixel Screenshots, mas antes não obtiveram sucesso com os resumos Gemini no Recorder.
  • Transcrições e resumos no Recorder costumavam apresentar dificuldades com gravações longas, o que limitava a utilidade da ferramenta em cenários do mundo real.
  • O Gemini Nano atualizado com multimodalidade na série Pixel 9 permite transcrições para gravações mais longas, de mais de 40 minutos.




O Google está fazendo investimentos significativos em IA, mas suas ferramentas são frequentemente imprevisíveis. Para referência, o novo aplicativo Pixel Screenshots é um sucesso definitivo, pois analisa e organiza de forma inteligente as capturas de tela que você captura, ajudando você a encontrá-las facilmente em uma data posterior com prompts de pesquisa conversacionais.

Por outro lado, recursos habilitados por IA, como os resumos Gemini para o Google Recorder, foram um fracasso total.

Relacionado

Os resumos do Gemini Recorder do Google não podem ser muito longos ou muito curtos

O recurso impressionante só funciona se suas gravações estiverem corretas


O recurso Gemini Nano no dispositivo é meticuloso, para dizer o mínimo. Ele promete resumos de transcrição em tempo real dentro do aplicativo Recorder, embora frequentemente exiba um erro “Transcript is too short” quando sua gravação tem menos de um minuto de duração e um erro “Transcript is too long” quando tem mais de 15 minutos.

O primeiro provavelmente não é um grande problema, mas o último é, considerando que, em cenários do mundo real, os resumos costumam ser mais úteis para conteúdos mais longos, semelhantes aos que você vê como resumos de principais conclusões no início deste artigo.

De acordo com um novo relatório do Android Authority por Mishaal Rahman, o recurso habilitado para IA será um pouco menos limitado na série Pixel 9.


Gemini Nano com multimodalidade reduz algumas limitações

Relacionado

O Google Recorder está ficando ainda melhor com um novo atalho de aplicativo

Inicie rapidamente uma gravação de áudio com o toque de um botão


O recurso de resumo de transcrição no dispositivo usa o Gemini Nano LLM do Google, especificamente para processar suas gravações diretamente no seu dispositivo. A série Pixel 9, por outro lado, usa um LLM avançado chamado Gemini Nano com multimodalidade, que permite gerar transcrições e resumos de gravações muito mais longas. Embora o corte exato seja atualmente desconhecido, de acordo com o relatório, Rahman conseguiu gerar uma transcrição de uma gravação com 41 minutos de duração, o que é um avanço significativo em relação ao corte de 15 minutos da série Pixel 8.

Vale a pena notar que, mesmo com o LLM atualizado, gravações de mais de uma hora ainda resultam em um erro “Transcript is too long”. Também vale a pena notar que, até agora, não há nenhuma indicação do Google sugerindo que o Gemini Nano com multimodalidade se expandirá para Pixels mais antigos, então transcrições longas de gravações no dispositivo podem permanecer exclusivas do Pixel 9.