O novo pacote de recursos do Android traz legendas que realmente mostram emoções

Principais conclusões

  • O Android Feature Bundle de dezembro do Google concentra-se em IA, acessibilidade e conveniência do usuário.
  • Expressive Captions adiciona tons e dicas ambientais para legendas ao vivo no Android 14 e superior, enquanto o Google Drive agora otimiza documentos digitalizados com contraste e equilíbrio de branco aprimorados.
  • O aplicativo Lookout – Assisted Vision do Google agora é desenvolvido com Gemini 1.5 Pro e os usuários agora têm a opção de usar códigos QR para compartilhar arquivos via Quick Share.




O Google anunciou hoje um novo lote de recursos chegando a alguns dos melhores smartphones Android como parte de seu pacote de recursos de dezembro de 2024, com foco principal em IA, acessibilidade e conveniência do usuário.

O pacote segue o lançamento de setembro de 2024, que trouxe recursos como descrições de imagens do TalkBack, identificação de músicas no Circle to Search, reprodução de leitura em voz alta de páginas da web no Chrome, a expansão dos alertas de terremoto e muito mais.

Relacionado

O pacote de recursos Android mais recente do Google traz mapas off-line para Wear OS e alertas de terremotos para todos os EUA

TalkBack também recebe uma atualização de visão


O destaque do pacote de recursos é uma atualização sólida para o recurso de acessibilidade Live Caption do Android. Em agosto, o Google expandiu o suporte ao Live Caption para sete novos idiomas – nomeadamente coreano, polonês, português, russo, chinês, turco e vietnamita. Hoje, a gigante da tecnologia está tornando essas legendas muito mais ‘expressivas’.

Apropriadamente chamado de Expressive Captions, o novo recurso “não apenas dirá o que alguém diz, mas como o diz”. Não deve ser confundido com o Live Transcribe, o novo recurso oferece essencialmente legendas para o som vindo do seu dispositivo – não para o som ao seu redor.

Exemplos de como as legendas expressivas aparecerão.

Fonte: Google


O Google sugere que as legendas expressivas sejam alimentadas por “múltiplos modelos de IA” e possam comunicar tom, volume, dicas ambientais e até ruídos humanos. Todas as legendas em maiúsculas refletiriam a intensidade da fala, enquanto suspiros, grunhidos, suspiros e sons semelhantes seriam claramente rotulados. Além disso, “rotularemos ruídos adicionais em primeiro e segundo plano, como aplausos e vivas, para fornecer uma imagem mais completa do que está acontecendo no ambiente”, escreveu a gigante da tecnologia.

As legendas expressivas estão disponíveis nos EUA a partir de hoje em dispositivos compatíveis com legendas ao vivo no Android 14 e superior.

Como parte do pacote, o aplicativo Lookout – Assisted Vision do Google também está recebendo uma grande atualização. Em 2022, o Google fez com que o aplicativo funcionasse sem conexão com a internet. O recurso, que basicamente usa IA para gerar descrições de imagens para o conteúdo da tela, juntamente com a capacidade de responder a perguntas de acompanhamento, agora está aprimorado com o Gemini 1.5 Pro. Isso deve resultar em descrições de imagens mais descritivas e ricas em comparação com as iterações anteriores.


Um GIF destacando o aplicativo Lookout - Visão assistida em ação.

Fonte: Google

Basta tirar, fazer upload ou abrir uma foto no aplicativo para ouvir a legenda lida em voz alta com uma voz natural. Você pode então obter uma compreensão mais profunda da imagem fazendo perguntas de acompanhamento, agora disponíveis globalmente.


Digitalize e compartilhe sem complicações

Um GIF destacando a nova opção de código QR do Quick Share.

Fonte: Google


Em outros lugares, os usuários agora têm uma maneira mais fácil de transferir fotos, vídeos e documentos de e para seus dispositivos Android. Conforme destacado pelo Google, os usuários agora têm a opção de usar códigos QR no Quick Share, eliminando a necessidade de adição de contatos ou verificação de dispositivos. Dicas sobre a funcionalidade do código QR começaram a surgir com a versão 24.20.13 do Google Play Services, em maio.

O último recurso importante refere-se aos aprimoramentos do Google Drive. Formulários, recibos, cartões de identificação ou outros documentos que você digitaliza através do seu dispositivo agora serão otimizados automaticamente com contraste e equilíbrio de branco aprimorados, combinados com a remoção de sombras e elementos desfocados – tudo sem a necessidade de editar nada manualmente.

Para usar o novo recurso, digitalize documentos por meio do ícone da câmera no aplicativo Google Drive. Após a digitalização, você poderá aplicar melhorias ao documento tocando no botão “Aprimorar” na tela de visualização (aquela com o logotipo Gemini). Você então tem a opção de nomear o arquivo e escolher se ele será salvo como PDF ou JPEG.


Capturas de tela destacando o recurso de aprimoramento automático de documentos digitalizados do Google Drive.

Fonte: Google

Por último, e isso não é realmente novidade – o Google oficializou hoje várias extensões Gemini, aquelas que vimos sendo lançadas no mês passado. Isso inclui a extensão Spotify que começou a ser lançada no final de novembro, extensões para telefone, mensagens e Whatsapp que começaram a ser lançadas ontem e a extensão Utilities lançada no início desta semana. A gigante da tecnologia também destacou que em breve os usuários poderão usar o Gemini para controlar seus dispositivos domésticos inteligentes, sugerindo que a extensão Google Home poderá sair em breve do Public Preview.


Relacionado

Extensão Google Home para Gemini sendo amplamente lançada em visualização pública

Diga adeus aos comandos complexos