Um Siri superalimentado por IA deve deixar o Google tremendo

Resumo

  • O novo Siri define o padrão para assistentes de voz, com ações impressionantes no aplicativo que exigem apenas comandos de voz, superando o Google Gemini.
  • O processamento de IA no dispositivo da Apple prioriza a privacidade e a eficiência, em parceria com a OpenAI para modelos avançados como o GPT-4o com o consentimento do usuário.
  • O Google deve intensificar as ações no aplicativo para acompanhar a Siri, enquanto o Rabbit R1 enfrenta desafios na adaptação do comportamento do usuário e na falta de personalização.



O maior anúncio na WWDC deste ano (depois daquele aplicativo de calculadora para iPad, é claro) foi o Apple Intelligence – a aposta da empresa na IA. A Apple anunciou um conjunto completo de recursos de IA, mas talvez a melhor coisa que resultou disso foram as melhorias do Siri. Costuma-se dizer que Siri é o pior assistente de voz entre seus pares. Mas a reforma generativa da IA ​​​​que acaba de receber pode impulsioná-lo muito à frente do Google Gemini, deixando hardware de IA dedicado como o Rabbit R1 comendo poeira.



O novo Siri é como os assistentes de voz deveriam ser

Não acredito que acabei de dizer isso

Francamente, muito se tem falado sobre a inteligência artificial e o seu potencial no último ano, mas pouco foi feito para mostrar a sua aplicação no mundo real além de um chatbot mais inteligente. Eu esperava que a Apple descobrisse casos de uso mais práticos e colocasse essa mensagem no palco, e ela realmente foi entregue nessas frentes – exceto para aqueles adesivos assustadores de desenho animado gerados por IA de seus contatos. Na verdade, a Apple deu um passo à frente para mostrar exatamente onde está o verdadeiro potencial da IA ​​no dispositivo.

O próximo salto lógico para os assistentes inteligentes que vivem no seu telefone é fazer coisas em seu nome dentro dos aplicativos. Se isso lhe parece familiar, então você não está errado. O Rabbit R1 afirma fazer exatamente isso, embora atualmente com um conjunto limitado de aplicativos. Eu queria que o Google acertasse isso com o Gemini, já que ele já tem tudo pronto para implantação, apenas as peças fragmentadas precisam ser montadas. Mas quando esperávamos que a Apple atualizasse o Siri com o Google Assistant, em vez disso, ele fez do Siri a referência para ações no aplicativo que não exigem nada mais do que entrada de voz proferida em seu idioma natural.


Você pode "Converse com Gêmeos," um assistente generativo de IA, no aplicativo Google Messages.

Em um vídeo de demonstração, a Apple mostrou como o novo Siri entende o contexto de tudo o que está no seu telefone, graças ao reconhecimento na tela, para ajudá-lo a fazer coisas como resumir artigos longos. Isso não é grande coisa, já que o Gemini já pode fazer isso até certo ponto, mas o que realmente me chamou a atenção foi o que ele fez no aplicativo Fotos.

Você poderá pedir ao Siri para editar uma foto, e isso será feito sem que você precise mexer nas ferramentas de edição. E você não precisa dizer especificamente para definir o contraste ou ajustar os realces, com os quais muitos usuários podem não estar familiarizados. Tudo que você precisa é simplesmente pedir para ele se destacar, como mostrado na demonstração, e ele entenderá o que você quer e fará isso. Embora alguns recursos do Gemini cheguem ao Google Fotos em breve, são principalmente ferramentas de descoberta e curadoria, fazendo com que as funções entre aplicativos do Siri, como anexar uma foto a um rascunho de e-mail com um comando de voz rápido, pareçam muito mais avançadas.


Relacionado

5 novos recursos do Gemini AI que podem mudar sua vida

Agora tudo o que o Google precisa fazer é entregar

Siri poderia comer Gêmeos e Coelho no almoço

Rabbit quer tornar os aplicativos uma coisa do passado. O que você obtém no R1 é uma interface de usuário bastante simplista, enquanto todo o processamento acontece nos servidores do Rabbit, onde ele interage com aplicativos em seu nome. Aquilo é perto de o futuro pretendido da IA, embora a abordagem do Rabbit esteja fadada ao fracasso principalmente por duas razões.

Por um lado, tenta recondicionar a forma como usamos nossos smartphones hoje, o que é mais fácil falar do que fazer, já que a mudança de hábitos geralmente não é bem aceita. Existe um meio-termo viável onde você pode usar seus aplicativos normalmente, ao mesmo tempo que tem a opção de delegar qualquer tarefa à IA quando não quiser fazê-lo manualmente. Em segundo lugar, o Rabbit R1 existe num ecossistema próprio, enquanto a IA realmente prospera quando tem muitas informações sobre você. Isso significa que o Rabbit simplesmente não consegue personalizar suas respostas da mesma forma que seu smartphone atual. Isso dá uma grande vantagem aos ecossistemas existentes – nomeadamente Apple e Google.


O Rabbit R1 na mão mostrando sugestões de viagem usando IA

Fonte: Coelho

Ambos os gigantes da tecnologia estão preparados para tornar realidade as interações no aplicativo por meio de IA. Acontece que a Apple aproveitou esse recurso útil com seu novo Siri superalimentado. Na palestra I/O do mês passado, o Google demonstrou os avanços feitos no Gemini, incluindo integrações mais profundas, o Projeto Astra para pesquisas visuais em tempo real e as temidas visões gerais de IA na pesquisa. Embora o Google tenha mencionado que a IA está fazendo coisas em seu nome, ela não tem nada para mostrar no palco. E apenas um mês depois, temos a Apple avançando bem à frente do Google em uma área que este sempre teve uma fortaleza.


Muito para gostar

E se preocupe também

Como seria de esperar, a Apple inclinou-se fortemente para a privacidade. A maior parte do processamento de IA ocorre no dispositivo (portanto, suporte limitado ao dispositivo), enquanto as consultas enviadas para a nuvem da Apple são consideradas tão privadas quanto as do seu telefone. A Apple está usando seus próprios modelos generativos e de linguagem treinados especificamente para essas tarefas, tornando-os muito mais eficientes com os recursos limitados de um smartphone. Além disso, a parceria da Apple com a OpenAI permite acesso ao modelo GPT-4o mais recente, com a Siri obtendo sua permissão explícita antes de encaminhar qualquer coisa para a OpenAI.


No entanto, essas demos chamativas e pré-gravadas mostram apenas um lado da história. É difícil dizer até que ponto esses recursos funcionarão no mundo real, e isso não ajuda a causa de muitos dos truques de IA da Siri só serem implementados no próximo ano. Além disso, as demonstrações da Siri mostravam apenas aplicativos originais para ações no aplicativo. Embora a Apple tenha mencionado a API App Intent para permitir a entrada de outros desenvolvedores, resta saber se a implementação real teve um começo difícil ou não.

Relacionado

O Rabbit R1 é um ótimo projeto de garagem que implora para ser adquirido

Se é apenas um aplicativo, por que seu telefone atual não deveria tê-lo?

No entanto, toda essa saga da Siri deve fornecer ao Google algum motivo para reflexão. Foi lisonjeiro que a Apple tenha roubado os temas de ícones do Material You do Android, então é justo que o Google emule as ações do Siri no aplicativo. Caso contrário, Gemini ficará mais uma vez para trás na curva, o que tenho certeza que os executivos do Google coçando a cabeça desde a WWDC24 não gostariam. Enquanto isso, o Coelho, por mais duro que possa parecer, deveria começar a contar seus dias, a menos que queira ser salvo por um dos grandes felinos da selva, o que, como você pode imaginar, também não seria um conto de fadas.