O Google quer usar suas fotos e pesquisas para construir um contador de histórias de IA

Resumo

  • O Gemini do Google é um modelo de linguagem poderoso que visa superar o GPT-4 da OpenAI, com a capacidade de compreender texto, imagens, vídeo, áudio e muito mais.
  • Gemini impulsionará o Projeto Ellmann, um projeto de IA do Google que usa suas pesquisas, fotos e arquivos pessoais para criar um chatbot que conta a história de sua vida.
  • A IA pode extrair momentos significativos de seus dados e fazer suposições fundamentadas sobre seus interesses, hobbies e até mesmo rotina alimentar, mas não há garantia de que isso será divulgado ao público.


O Google apresentou recentemente o “Gemini”, seu mais recente modelo de linguagem grande que visa derrubar o GPT-4 da OpenAI. É um LLM multimodal, que compreende texto, imagens, vídeo, áudio e muito mais. O Google está ávido por dados para manter o Gemini afiado, e isso inclui aproveitar suas pesquisas e fotos pessoais para impulsionar seu crescimento por meio de um novo projeto de IA.

De acordo com documentos internos obtidos pela CNBC, o Google está investindo no Projeto Ellmann, que espionará suas fotos, arquivos e histórico de pesquisa com o objetivo de transformar “sua história de vida” em um chatbot. A empresa deu-lhe o nome do falecido biógrafo Richard David Ellmann.

Com Gemini no comando, esta IA está preparada para lhe dar uma “visão panorâmica” virtual da sua vida. Ele mergulha em sua conta do Google, captura arquivos e até verifica biografias escritas e momentos passados ​​para ter uma visão completa. Ele pode atuar como seu detetive digital, examinando arquivos para destacar os eventos mais interessantes.

Ainda não se sabe se o Google tem um plano para implementar esses truques no Google Fotos. Em novembro, o gigante das buscas revelou a nova capacidade do Google Fotos de classificar fotos semelhantes em álbuns amigáveis ​​e organizar suas capturas de tela.

Durante uma recente “cúpula interna” onde executivos e funcionários da empresa apresentaram o projeto, a equipe do Google afirmou que a IA pode descobrir sua data de nascimento ou se você tem irmãos. O objetivo é extrair momentos significativos de suas coisas e metadados para entrelaçar sua história de vida. Pense em formaturas, reuniões de classe, casamentos e paternidade. E se isso não bastasse, é bisbilhotar suas fotos e hábitos de pesquisa para adivinhar seus interesses, principais aplicativos, animais de estimação e outros enfeites.

Ellman chega ao ponto de melhorar sua rotina alimentar. Digamos, você o inunda com fotos de pizza e macarrão; a IA então conecta os pontos e descobre que você provavelmente é um fanático por comida italiana.

A apresentação do Google finalmente introduziu o Ellman Chat – basicamente ChatGPT, mas atualizado para lidar com questões que antes eram consideradas impossíveis. Embora, sejamos realistas, essas questões não são exatamente ciência de foguetes; eles são um pouco astutos, especialmente se você é do tipo que esquece as coisas. Por exemplo, você pode acessar o chatbot para lembrar a última vez que seu irmão apareceu ou obter sugestões de localização para seu próximo passo, tudo com base nas fotos que você lançar em seu caminho.

O chatbot também pode fazer suposições fundamentadas sobre seus hobbies, interesses, planos de viagem, compras, sites favoritos e muito mais por meio das capturas de tela que você tira. Um porta-voz do Google disse à CNBC que a empresa está apenas chutando os pneus por enquanto. Se decidirem implementá-lo, eles prometem dedicar seu tempo para garantir que seja genuinamente útil para as pessoas e, é claro, mantendo a privacidade do usuário em primeiro lugar.

Escusado será dizer que prepare-se para o fator de arrepio final se Ellman vir a luz do dia. Esta IA está se aprofundando em seus arquivos, procurando cada pedaço de dados que puder colocar em suas patas virtuais. No entanto, não há garantia de que a IA fará uma estreia pública.