A visão geral de áudio do Google pode transformar notas de pesquisa insípidas em podcasts

O NotebookLM com tecnologia de IA do Google chegou totalmente. Foi revelado no I/O 2023 e depois demonstrado com oohs e ahs no evento de 2024. NotebookLM removeu seu rótulo experimental em meados de outubro, sinalizando que estava pronto para o horário nobre. Isso é especialmente digno de nota dado o histórico do Google de apresentar conceitos intrigantes no I/O que nunca se materializam.




Embora eu não queira prejudicar o excelente trabalho do Google no avanço da tecnologia com projetos como o Gemini e sua série Google Pixel, houve falsos começos. Lembra-se do editor de fotos mágico para remover cercas, do plano ambicioso para smartphones modulares com componentes intercambiáveis ​​​​e da demonstração do Projeto Astra deste ano com o retorno do Google Glass? Embora essas demonstrações tentadoras muitas vezes desapareçam no reino do vaporware, desta vez é diferente. Aqui está o porquê.


As visões gerais de áudio transformam informações insípidas em podcasts divertidos

Imagine o seguinte: em vez de se esforçar para ler trabalhos de pesquisa densos ou relatórios extensos, você carrega seus documentos no NotebookLM e relaxa com uma xícara de café. Em poucos minutos, você está ouvindo um podcast cativante onde dois “apresentadores” de IA têm uma discussão dinâmica e envolvente sobre o material. Eles dissecam conceitos complexos, destacam descobertas importantes e debatem diferentes perspectivas, mantendo uma cadência surpreendentemente natural.


Esta é a magia das visões gerais de áudio do NotebookLM. Não se trata apenas de resumir informações. Trata-se de dar vida a isso. Os hosts de IA não regurgitam os fatos em seus documentos. Eles têm discussões ponderadas, fazem perguntas perspicazes e até acrescentam um pouco de humor à mistura.

As visões gerais de áudio ainda não são perfeitas

Criei um Notebook com quatro fontes do Android Police, incluindo três artigos e um vídeo do YouTube, um sobre Android 15 e outro com comparação com iOS 18. Injetei meus prompts, como “Compare e contraste o escopo das atualizações no Android 15 versus iOS 18.” Também usei alguns dos prompts sugeridos para criar notas individuais em meu caderno. Acabei com 14 notas e um esboço em meu caderno antes de iniciar a criação da minha primeira Visão Geral de Áudio.


O resultado foi bom, mas não exatamente o que eu queria. O primeiro podcast criado focou quase exclusivamente no Android 15 e não colocou ênfase suficiente nas comparações com o iOS 18. Isso provavelmente ocorreu porque três dos meus quatro documentos originais discutiram o Android 15, enquanto apenas um mergulhou na comparação dos sistemas operacionais.

NotebookLM personaliza o prompt de visão geral do áudio.

Depois de baixar meu primeiro podcast, tive que excluí-lo antes que o NotebookLM me permitisse criar um novo. Depois de algumas sondagens, Gemini me informou que eu precisava criar um novo Notebook antes de criar uma nova Visão Geral de Áudio. Essa não é uma solução elegante. Você encontrará outros pequenos aborrecimentos em toda a interface do usuário, que podem precisar de alguma iteração.


Adicionei um novo artigo fonte sobre o iOS 18 para criar uma saída mais equilibrada. Em seguida, usei a função Personalizar para refazer o podcast com uma solicitação para dar mais ênfase à comparação. O segundo podcast foi mais direto ao que eu queria. Em outras palavras, a saída de visões gerais de áudio do NotebookLM é tão boa quanto as fontes que você insere. Se as fontes em uma comparação não estiverem balanceadas, sua saída não será balanceada.

Relacionado

Testei o NotebookLM e vi a promessa de algo ótimo

NotebookLM tem muitos problemas, mas a ideia por trás dele tem potencial

Um assistente de pesquisa pessoal alimentado por seus dados

NotebookLM é como um assistente pessoal de pesquisa. Ele sintetiza informações de seus documentos, responde suas perguntas e colabora com você para explorar ideias e soluções. Ao contrário das ferramentas de chatbot de IA que coletam informações da Internet, o NotebookLM aproveita seus dados.

Uma visão geral do Google NotebookLM


NotebookLM é compatível com vários tipos de arquivos, o que o torna uma ferramenta versátil para analisar e sintetizar informações. Você pode importar Documentos e Apresentações Google, fazer upload de PDFs e analisar texto simples ou arquivos Markdown. Além desses tipos de arquivos principais, o NotebookLM estende seus recursos a páginas da web, vídeos do YouTube e arquivos de áudio. Este amplo suporte permite reunir diversas fontes de informação. No entanto, existem limitações. Atualmente, os arquivos de planilha não são suportados, os tamanhos dos arquivos são limitados a 500.000 palavras ou 200 MB e cada bloco de notas tem um limite de 50 fontes.

Seus documentos carregados permitem que o NotebookLM alcance uma compreensão mais profunda e uma análise personalizada do que é possível com ferramentas de IA generalizadas. Não se trata apenas da profundidade da análise. NotebookLM fornece uma UI superior, embora imperfeita, para organizar e interagir com um conjunto de informações relacionadas. Embora o Gemini tenha uma interface tradicional em estilo de bate-papo, o NotebookLM oferece um espaço de trabalho visualmente rico que lembra notebooks físicos. Você pode organizar seus materiais de origem, destacar passagens importantes e anotar pensamentos junto com os insights da IA.


A IU do NotebookLM é relativamente simplificada

O Google anunciou o NotebookLM Business em outubro, uma versão paga com recursos aprimorados para empresas e universidades. NotebookLM Business está em um piloto de lançamento limitado e promete integrações ao Workspace que não estão disponíveis na versão gratuita atual. Embora vejamos os benefícios do NotebookLM para negócios, pesquisa profissional e estudo, suas implicações potenciais vão além.

Além de trabalhos de pesquisa e trabalhos de casa

A capacidade do NotebookLM de ingerir, processar e analisar informações complexas e depois transformá-las em conteúdo perspicaz e divertido indica seu vasto potencial. Esqueça trabalhos de pesquisa e trabalhos de casa. Isso poderia prenunciar como consumiremos todas as informações no futuro. Com o NotebookLM integrado ao Chrome, cada página da web pode ser transformada em uma experiência de áudio cativante.


Hoje, o Google fornece resumos de IA dos resultados de pesquisa. Amanhã, o mecanismo NotebookLM poderá criar podcasts envolventes para responder às suas dúvidas. Em vez de consumir muito conteúdo para compreender um tópico, uma única visão geral de áudio do NotebookLM poderia cobrir o mesmo terreno com uma perspectiva mais holística.

Resultados de pesquisa aprimorados por IA do Google

É fácil imaginar o Google aplicando visões gerais de áudio aos resultados de pesquisa aprimorados por IA já existentes.

A colaboração também poderia ser revolucionada através do compartilhamento de cadernos que agregam e cristalizam ideias entre amigos, familiares e colegas de trabalho. À medida que sua capacidade de armazenamento e retenção aumenta, o NotebookLM pode lembrar seu histórico médico ao longo da vida e antecipar suas necessidades de saúde.

Relacionado

Como desativar o recurso Visão geral de IA do Google

Não existe uma maneira direta, mas você pode usar essas soluções alternativas para se livrar das visões gerais de IA dos resultados da pesquisa


O futuro do conteúdo?

NotebookLM emergiu de sua fase experimental com recursos atraentes, especialmente suas visões gerais de áudio. Embora tenha limitações, a sua capacidade de transformar informações em conteúdos dinâmicos e envolventes aponta para um futuro onde o consumo de conteúdos, a aprendizagem e a colaboração se tornarão mais fáceis, rápidos e agradáveis.

Imagine um mundo onde pesquisas complexas, notícias diárias e histórias pessoais são organizadas, compartilhadas e consumidas sem esforço por meio de podcasts alimentados por IA e aplicativos de anotações com ferramentas de IA. Esta é a promessa do NotebookLM. Ao contrário das demonstrações anteriores de I/O, parece que o Google pode aproveitar o potencial do NotebookLM de uma forma que poderá remodelar a forma como interagimos com as informações no futuro.