O Google Gemini é promissor, mas ainda não pode substituir o Assistant

Já faz algum tempo que ouvimos que o Google está se preparando para uma reformulação da marca de seu chatbot de IA, anteriormente conhecido como Bard. A empresa surpreendeu a todos nós hoje ao implementar essa mudança em vigor: Bard agora é Gemini, em homenagem ao LLM que alimenta a experiência. Há também um novo aplicativo Gemini disponível, e você pode defini-lo como o assistente de voz padrão do seu telefone Android, que verá o Gemini aparecer onde o Assistente apareceria antes. Estou brincando com o novo assistente de IA há algumas horas e às vezes é incrível. Não acho que seja necessariamente um bom substituto – pelo menos não ainda.


O aplicativo Gemini já está disponível na Play Store. À primeira vista, não parece muito mais do que um invólucro para a experiência Bard baseada em navegador que está disponível há algum tempo. Você pode interagir com Gemini por voz, texto ou enviando uma foto; as interações são apresentadas como conversas de bate-papo que você pode percorrer. Gemini também salva suas conversas para que você possa consultá-las mais tarde. Você pode excluir essas conversas ou fixá-las para acesso rápido. Se você estiver usando o Gemini para fazer brainstorming ou pesquisar tópicos específicos, esses recursos de organização provavelmente serão muito úteis.

Você pode configurar o novo aplicativo Gemini para funcionar como assistente de voz padrão do seu telefone. Se você decidir fazer isso, o Gemini responderá em vez do Assistente quando você deslizar a partir do canto da tela ou dizer Olá, Google. Um grande benefício de ter o Gemini como seu assistente de voz é que ele responde muito melhor a perguntas complexas – o tipo de consulta que retornaria “Não sei, mas encontrei esses resultados na Pesquisa” do Google Assistente.

Pedi ao Gemini que nomeasse bandas semelhantes ao grupo pós-punk do Reino Unido, Idles, e isso me serviu uma seleção de artistas que se enquadravam no perfil, completa com pequenos trechos que explicavam como cada um atendia aos meus critérios de pesquisa. Pedi truques fáceis de ensinar aos filhotes e ele voltou com uma lista de comandos simples (sentar, sacudir, deitar) e breves instruções sobre como ensiná-los.

google-gemini-animação-anim

Como o Gemini é um chatbot, você pode responder às suas respostas – você pode conversar com ele. Depois que Gêmeos me deu aquela lista de comandos para cachorrinhos, pedi mais informações sobre como ensinar “shake”, e ele me deu um plano abrangente de seis etapas, completo com lembretes para ser paciente e usar reforço positivo.

Existe um Google G botão apresentado com cada resposta que você pode tocar para que o Google verifique seu próprio trabalho. Ele destacará diferentes seções da resposta de Gemini e citará fontes retiradas da Pesquisa Google que dizem coisas semelhantes. Esse botão nem sempre funciona; Will Sattelberg, da AP, diz que Gemini não conseguiu identificar imprecisões factuais nas respostas que recebeu. Tentei fazer com que o Gemini verificasse os fatos de seu plano de “agitação” e ele apenas disse “Nenhum resultado encontrado”.

E se você perguntar ao Gêmeos de onde vêm suas respostas, especificamente, ele não lhe dirá – Gêmeos diz que suas instruções sobre como ensinar um filhote a agitar as patas “são baseadas em práticas comuns usadas tanto por treinadores de cães quanto por donos de animais de estimação”, e que eles “não são atribuídos a nenhuma fonte ou indivíduo específico”.

Eu aceitaria esse tipo de resposta de uma pessoa, mas vindo de um chatbot que usa fontes específicas, não é nada satisfatório e, como alguém que escreve online, isso realmente me irrita. Gêmeos poderia muito bem repetir meus escritos sobre determinados tópicos e depois se recusar a dizer de onde conseguiu essas informações. Isso me parece muito plágio, mas esse é o blog.


A integração com outros produtos do Google é onde o Gemini realmente se torna interessante. Depois de vinculá-lo ao Google Workspace (ele solicitará que você faça isso quando precisar de acesso), você poderá fazer com que o Gemini pesquise no Gmail e no Google Drive informações sobre tópicos específicos. Nem sempre sabe quando fazer isso – perguntei ao Gemini quando alguns livros que encomendei chegariam e ele pediu mais informações. Eu disse que deveria receber um e-mail de confirmação, e ele encontrou esse e-mail na minha caixa de entrada do Gmail e me informou que os livros estavam para entrega.

Essa facilidade de acesso às informações espalhadas pela minha conta do Google é o tipo de magia do ecossistema que o Assistente sempre pareceu oferecer, mas nunca o fez. É o começo do Gemini e não acho que o aplicativo esteja pronto para o horário nobre ainda. Devo pensar que o Google está permitindo que os usuários optem pela experiência do assistente com tecnologia Gemini agora para resolver os problemas antes que eventualmente se torne o padrão – uma boa jogada, porque ainda existem muitos problemas.

A integração com outros produtos do Google é onde o Gemini realmente se torna interessante.

Até agora, o Gemini parece mais lento que o Assistant: as interações iniciadas com Olá Google demora estranhamente para começar, com alguns instantes entre o momento em que você para de falar e o momento em que Gemini registra que você terminou (você pode tocar em um botão enviar para avisar que terminou, mas isso não ajuda se seu telefone está fora do alcance do braço). As interações também demoram mais em geral, com o Gemini aparentemente processando suas entradas por muito mais tempo do que o Assistant jamais faz.

Para muitas tarefas que você normalmente realizaria com o Assistant, o Gemini apenas retransmite sua opinião. Os comandos para controle de luzes inteligentes, por exemplo, ainda passam pelo Google Assistente, tendo o Gemini como intermediário. E comandos como esse só funcionam por voz: se você digitar algo como “acender as luzes”, o Gemini dirá que “não pode ajudar no controle de dispositivos físicos no mundo real”. Nem menciona o uso de entrada de voz.

Gemini também parece facilmente confuso, em geral: perguntei quanta bateria me restava, presumindo que ele saberia o que eu queria dizer no telefone com o qual estava falando no momento, e isso me deu o nível de bateria do meu aspirador inteligente. Quando especifiquei “… neste telefone”, ele me forneceu as informações corretas.

Relacionado

Google Gemini: tudo o que você precisa saber sobre a IA multimodal de última geração do Google

O Google Gemini está aqui, com uma abordagem totalmente nova para IA multimodal: aqui está o que você deve saber.

Porém, ainda é cedo para Gêmeos e ainda não tivemos muito tempo para experimentá-lo. Mesmo assim, é fácil ver como o Gemini poderia aproveitar as melhores partes do Assistant para criar um assistente digital que fosse realmente útil. Com todo o burburinho em torno da IA ​​no momento, estou confiante de que o Google continuará com o Gemini, pelo menos no curto prazo – e com base na minha experiência com ele hoje, deixando de lado as preocupações com a fonte de informações, estou realmente animado sobre essa possibilidade.