Os resumos do Gemini Recorder do Google não podem ser muito longos ou muito curtos

Resumo

  • O Pixel Feature Drop do Google em dezembro apresentou o Gemini Nano no Pixel 8 Pro, uma versão leve da plataforma de IA do Google, capacitando recursos como Resposta Inteligente aprimorada e resumos para o Google Recorder.
  • Os resumos do Gemini no Recorder têm limitações – a IA não resumirá uma gravação com menos de um minuto ou mais de 15 minutos e bloqueará conteúdo prejudicial com base em recursos de segurança.
  • Quando usado dentro do tempo de gravação recomendado e sem conteúdo prejudicial, o resumo de IA no Google Recorder fornece resumos convenientes acima da transcrição, beneficiando estudantes e profissionais.


O Pixel Feature Drop do Google em dezembro foi enorme, trazendo novas funcionalidades divertidas para Pixels mais antigos e, ao mesmo tempo, entregando vários recursos prometidos para a série Pixel 8. O Pixel 8 Pro, em particular, obteve seu modelo de IA totalmente básico no dispositivo, e descobriu-se que não era outro senão Gemini Nano, a versão leve da plataforma de IA multimodal do Google destinada a competir com o GPT-4. O Gemini Nano será usado para potencializar recursos como uma resposta inteligente aprimorada no Gboard e resumos para o Google Recorder. Esse último começou a ser lançado hoje e é muito mais complicado do que você imagina.

Depois do usuário do Twitter Andreas Proschofsky apontou alguns comportamentos interessantes e Mishaal Rahman trouxemos isso à nossa atenção, fizemos alguns testes e descobrimos que o Gemini não resumirá uma transcrição se a gravação tiver menos de um minuto de duração – em vez disso, você receberá uma mensagem de erro dizendo “A transcrição é muito curta”. Mas sua gravação também não pode ser muito longa – se durar mais de 15 minutos, a mensagem dirá “A transcrição é muito longa”. O aplicativo sugere que você tente uma gravação diferente e informa que “O resumo funciona melhor com transcrições de tamanho médio”.

A documentação do Google para o recurso aponta outro exemplo de sua IA ser exigente: ao transcrever, o Gemini Nano “usa restrições incluídas nos recursos de segurança para bloquear conteúdo prejudicial”. Exatamente o que constitui conteúdo prejudicial não é divulgado, mas a Política de Uso Proibido de IA Generativa do Google, que está vinculada nos ToS exibidos junto com esses resumos, destaca “atividades perigosas, ilegais ou maliciosas”, bem como “conteúdo destinado a desinformar, deturpar ou enganar” e “conteúdo sexualmente explícito” como os três principais tipos de violações.

Mas quando sua gravação está na zona Cachinhos Dourados de 1 a 15 minutos e não inclui conteúdo prejudicial, as coisas começam a melhorar para o recurso de resumo de IA. Tocar no botão Resumir na parte superior da guia de transcrição de uma gravação fará com que uma folha inferior apareça informando sobre os fundamentos do recurso. Tocar em OK aqui produz outra folha inferior, desta vez informando que o Gravador precisa baixar um modelo de IA. Quando terminar, você verá um resumo da gravação na forma de alguns marcadores logo acima da transcrição.

Os resumos não são nada inovadores – na prática, eles não são muito diferentes da seção Resumo que você vê no início deste artigo – mas ter as principais conclusões no topo das transcrições será uma bênção para estudantes e profissionais. e ser capaz de fazer tudo isso apenas com o telefone é uma melhoria legítima na qualidade de vida. Mas embora o limite inferior de um minuto faça sentido quando a maioria dessas gravações não tem muito para resumir, o limite superior de 15 minutos é uma limitação significativa em casos de uso do mundo real.