Vazamento do ‘Projeto Jarvis’ destaca o superpoder do Google Gemini 2.0

Principais conclusões

  • Um novo relatório lançou luz sobre o próximo agente de IA do Google, codinome “Projeto Jarvis”.
  • O Projeto Jarvis pode automatizar tarefas baseadas na web, como reserva de voos, e será desenvolvido com Gemini 2.0.
  • Espera-se que o Google oficialize o Projeto Jarvis em dezembro, mas seu lançamento pode ser limitado a algumas pessoas para fins de teste.




O Google tem grandes ambições para IA, como fica evidente pelos inúmeros ajustes e atualizações que fez no chatbot Gemini nos últimos meses. Durante a conferência de desenvolvedores I/O em maio, a empresa falou brevemente sobre um “agente universal de IA útil na vida cotidiana“com o Google dizendo que algumas das funcionalidades deste agente de IA podem chegar ao Gemini este ano. Um novo relatório no fim de semana revelou alguns novos detalhes sobre os planos do Google para este agente de IA.

Relacionado

O Projeto Astra do Google leva Gemini AI para o mundo real

A ideia do Google Glass está evoluindo em um hiato


De acordo com reportagem exclusiva da The Information (paywalled), este projeto em subdesenvolvimento – supostamente com o codinome Projeto Jarvis – aproveitará o navegador do usuário para realizar uma das muitas tarefas, como reservar voos, pesquisar informações ou comprar um produto (via The Verge). O Google planeja apresentar o Projeto Jarvis em dezembro, com a experiência adaptada para o Google Chrome, afirma o relatório.

Ele será equipado com Gemini 2.0, com lançamento previsto para dezembro, então o momento não poderia ser melhor. O Google deseja implementar inicialmente os recursos desse agente de IA para um pequeno grupo de usuários para teste, por isso não esperamos encontrar amplo acesso ao Jarvis quando ele for oficialmente apresentado. Também vale lembrar que o cronograma de lançamento para dezembro não está definido e o Google pode optar por não exibir Jarvis e suas capacidades até então, como aponta The Information.


Então, como isso funciona?

Gemini Live rodando no Google Pixel 9 Pro XL


Com base nos relatórios da publicação, o Projeto Jarvis foi projetado para “automatizar tarefas diárias baseadas na web”, capturando capturas de tela da tela continuamente e compreendendo-as antes que o usuário possa oferecer informações adicionais por meio da caixa de texto ou tocando em um botão. No entanto, nota-se que as respostas estão um tanto lentas neste momento “porque o modelo precisa pensar alguns segundos antes de realizar cada ação”. Isso sugere que Jarvis pode não estar pronto para o horário nobre ainda.

A publicação teria conversado com três pessoas que tinham conhecimento direto do assunto, embora não haja imagens ou vídeos disponíveis para demonstrar como Jarvis funcionaria. Mas, como Will Sattelberg observou em sua cobertura do I/O 2024, esse agente de IA se parece com “uma versão funcional do que Humane e Rabbit prometeram em seu hardware dedicado.” Com dezembro quase chegando, esperamos aprender mais sobre o Projeto Jarvis e o que ele pode fazer nas próximas semanas.