Resumo
- O novo Siri define o padrão para assistentes de voz, com ações impressionantes no aplicativo que exigem apenas comandos de voz, superando o Google Gemini.
- O processamento de IA no dispositivo da Apple prioriza a privacidade e a eficiência, em parceria com a OpenAI para modelos avançados como o GPT-4o com o consentimento do usuário.
- O Google deve intensificar as ações no aplicativo para acompanhar a Siri, enquanto o Rabbit R1 enfrenta desafios na adaptação do comportamento do usuário e na falta de personalização.
O maior anúncio na WWDC deste ano (depois daquele aplicativo de calculadora para iPad, é claro) foi o Apple Intelligence – a aposta da empresa na IA. A Apple anunciou um conjunto completo de recursos de IA, mas talvez a melhor coisa que resultou disso foram as melhorias do Siri. Costuma-se dizer que Siri é o pior assistente de voz entre seus pares. Mas a reforma generativa da IA que acaba de receber pode impulsioná-lo muito à frente do Google Gemini, deixando hardware de IA dedicado como o Rabbit R1 comendo poeira.
O novo Siri é como os assistentes de voz deveriam ser
Não acredito que acabei de dizer isso
Francamente, muito se tem falado sobre a inteligência artificial e o seu potencial no último ano, mas pouco foi feito para mostrar a sua aplicação no mundo real além de um chatbot mais inteligente. Eu esperava que a Apple descobrisse casos de uso mais práticos e colocasse essa mensagem no palco, e ela realmente foi entregue nessas frentes – exceto para aqueles adesivos assustadores de desenho animado gerados por IA de seus contatos. Na verdade, a Apple deu um passo à frente para mostrar exatamente onde está o verdadeiro potencial da IA no dispositivo.
O próximo salto lógico para os assistentes inteligentes que vivem no seu telefone é fazer coisas em seu nome dentro dos aplicativos. Se isso lhe parece familiar, então você não está errado. O Rabbit R1 afirma fazer exatamente isso, embora atualmente com um conjunto limitado de aplicativos. Eu queria que o Google acertasse isso com o Gemini, já que ele já tem tudo pronto para implantação, apenas as peças fragmentadas precisam ser montadas. Mas quando esperávamos que a Apple atualizasse o Siri com o Google Assistant, em vez disso, ele fez do Siri a referência para ações no aplicativo que não exigem nada mais do que entrada de voz proferida em seu idioma natural.
Em um vídeo de demonstração, a Apple mostrou como o novo Siri entende o contexto de tudo o que está no seu telefone, graças ao reconhecimento na tela, para ajudá-lo a fazer coisas como resumir artigos longos. Isso não é grande coisa, já que o Gemini já pode fazer isso até certo ponto, mas o que realmente me chamou a atenção foi o que ele fez no aplicativo Fotos.
Você poderá pedir ao Siri para editar uma foto, e isso será feito sem que você precise mexer nas ferramentas de edição. E você não precisa dizer especificamente para definir o contraste ou ajustar os realces, com os quais muitos usuários podem não estar familiarizados. Tudo que você precisa é simplesmente pedir para ele se destacar, como mostrado na demonstração, e ele entenderá o que você quer e fará isso. Embora alguns recursos do Gemini cheguem ao Google Fotos em breve, são principalmente ferramentas de descoberta e curadoria, fazendo com que as funções entre aplicativos do Siri, como anexar uma foto a um rascunho de e-mail com um comando de voz rápido, pareçam muito mais avançadas.
5 novos recursos do Gemini AI que podem mudar sua vida
Agora tudo o que o Google precisa fazer é entregar
Siri poderia comer Gêmeos e Coelho no almoço
Rabbit quer tornar os aplicativos uma coisa do passado. O que você obtém no R1 é uma interface de usuário bastante simplista, enquanto todo o processamento acontece nos servidores do Rabbit, onde ele interage com aplicativos em seu nome. Aquilo é perto de o futuro pretendido da IA, embora a abordagem do Rabbit esteja fadada ao fracasso principalmente por duas razões.
Por um lado, tenta recondicionar a forma como usamos nossos smartphones hoje, o que é mais fácil falar do que fazer, já que a mudança de hábitos geralmente não é bem aceita. Existe um meio-termo viável onde você pode usar seus aplicativos normalmente, ao mesmo tempo que tem a opção de delegar qualquer tarefa à IA quando não quiser fazê-lo manualmente. Em segundo lugar, o Rabbit R1 existe num ecossistema próprio, enquanto a IA realmente prospera quando tem muitas informações sobre você. Isso significa que o Rabbit simplesmente não consegue personalizar suas respostas da mesma forma que seu smartphone atual. Isso dá uma grande vantagem aos ecossistemas existentes – nomeadamente Apple e Google.
Fonte: Coelho
Ambos os gigantes da tecnologia estão preparados para tornar realidade as interações no aplicativo por meio de IA. Acontece que a Apple aproveitou esse recurso útil com seu novo Siri superalimentado. Na palestra I/O do mês passado, o Google demonstrou os avanços feitos no Gemini, incluindo integrações mais profundas, o Projeto Astra para pesquisas visuais em tempo real e as temidas visões gerais de IA na pesquisa. Embora o Google tenha mencionado que a IA está fazendo coisas em seu nome, ela não tem nada para mostrar no palco. E apenas um mês depois, temos a Apple avançando bem à frente do Google em uma área que este sempre teve uma fortaleza.
Muito para gostar
E se preocupe também
Como seria de esperar, a Apple inclinou-se fortemente para a privacidade. A maior parte do processamento de IA ocorre no dispositivo (portanto, suporte limitado ao dispositivo), enquanto as consultas enviadas para a nuvem da Apple são consideradas tão privadas quanto as do seu telefone. A Apple está usando seus próprios modelos generativos e de linguagem treinados especificamente para essas tarefas, tornando-os muito mais eficientes com os recursos limitados de um smartphone. Além disso, a parceria da Apple com a OpenAI permite acesso ao modelo GPT-4o mais recente, com a Siri obtendo sua permissão explícita antes de encaminhar qualquer coisa para a OpenAI.
No entanto, essas demos chamativas e pré-gravadas mostram apenas um lado da história. É difícil dizer até que ponto esses recursos funcionarão no mundo real, e isso não ajuda a causa de muitos dos truques de IA da Siri só serem implementados no próximo ano. Além disso, as demonstrações da Siri mostravam apenas aplicativos originais para ações no aplicativo. Embora a Apple tenha mencionado a API App Intent para permitir a entrada de outros desenvolvedores, resta saber se a implementação real teve um começo difícil ou não.
O Rabbit R1 é um ótimo projeto de garagem que implora para ser adquirido
Se é apenas um aplicativo, por que seu telefone atual não deveria tê-lo?
No entanto, toda essa saga da Siri deve fornecer ao Google algum motivo para reflexão. Foi lisonjeiro que a Apple tenha roubado os temas de ícones do Material You do Android, então é justo que o Google emule as ações do Siri no aplicativo. Caso contrário, Gemini ficará mais uma vez para trás na curva, o que tenho certeza que os executivos do Google coçando a cabeça desde a WWDC24 não gostariam. Enquanto isso, o Coelho, por mais duro que possa parecer, deveria começar a contar seus dias, a menos que queira ser salvo por um dos grandes felinos da selva, o que, como você pode imaginar, também não seria um conto de fadas.