Estes são os 12 avanços de IA mais importantes do Google em 2023

Sem debate, 2023 poderá ficar na história como um dos momentos decisivos para a tecnologia de IA voltada para o consumidor. O ChatGPT da OpenAI conquistou o mundo no final de 2022, e todos os outros gigantes da tecnologia fizeram da IA o centro de seus respectivos esforços em 2023. O Google não foi diferente, gerando uma infinidade de projetos relacionados à IA para Android, sua linha Pixel e até mesmo Espaço de trabalho do Google.

Embora tenhamos tido um breve vislumbre desses projetos na conferência Google I/O em maio, dezembro está quase no passado. Então, é hora de dar uma olhada retrospectiva em todas essas ideias, porque, honestamente, ainda estamos aguardando a disponibilidade generalizada de algumas dessas tecnologias de IA. Em alguns casos, o Google até tentou enganar as massas com algumas demonstrações confusas, até mesmo potencialmente falsas.

Se você perdeu na primavera, o discurso principal do CEO Sundar Pichai no I/O é um ótimo jogo de bebida para as festas de fim de ano, com inúmeras menções cômicas à “IA” e, como você pode imaginar, a lista de lançamentos importantes em 2023 é igualmente apenas tanto tempo. Então, vamos mergulhar de cabeça.

Google Bardo

Imediatamente após o ChatGPT se estabelecer como uma forma aceitável de empacotar as infinitas possibilidades de IA generativa para o consumidor médio, o Google lançou o Bard em março deste ano. Assim como o ChatGPT, o Bard é um chatbot de IA conversacional que usa o modelo de linguagem para aplicativos de diálogo (LaMDA) do Google. Embora possa parecer uma resposta instintiva aos esforços da OpenAI – e considerando quando o Gemini foi lançado este ano, potencialmente foi – Bard está trabalhando há anos.

Suas capacidades incluem a capacidade de compreender e interpretar a linguagem natural falada pelos humanos, manter conversas e exibir compreensão contextual. Bard também supera a versão gratuita do ChatGPT com acesso a informações em tempo real. O Google melhorou o Bard com o LaMDA2, tornando-o um remédio ainda melhor para sua curiosidade mórbida sobre tudo, da aritmética ao Android e do Prometheus ao plâncton, e apenas neste mês lançou o Bard com tecnologia Gemini para competir com o ChatGPT 4.

Experiência generativa de pesquisa

Falando em curiosidade, a Pesquisa é a principal oferta do Google, e não é surpresa que a IA tenha sido uma grande parte da experiência do usuário na Pesquisa em 2023. Embora Bard possa responder às suas perguntas de forma satisfatória, sua precisão e raciocínio lógico ainda nos deixam com vontade de melhorias. Além disso, a Pesquisa tem o benefício adicional de exibir resultados da web, o que Bard só faz mediante solicitação.

Combinando recursos de IA generativa do tipo Bard com a Pesquisa, o Google introduziu a Experiência Gerativa de Pesquisa por meio do programa Search Labs. Como o nome sugere, é puramente experimental, apesar da sua ampla disponibilidade em inglês. SGE precede os links da web na página de resultados da pesquisa, oferecendo pequenas informações que respondem sumariamente à sua consulta. Eles podem ser imprecisos, mas o Google também adiciona uma linha de perguntas de acompanhamento com um toque que você pode fazer, assim como faria com Bard. Como alternativa, você pode rolar o resumo gerado pela IA e continuar visitando os links da web.

Gêmeos

Em sua busca por substitutos poderosos para o LaMDA2 (trocadilho intencional), o Google desenvolveu o Gemini, enfrentando o modelo de linguagem GPT4 da OpenAI. O Gemini é voltado principalmente para empresas, mas tem dois USPs que nos deixam entusiasmados com as possibilidades desse versátil modelo de IA entrar em 2024, mesmo que o vídeo de demonstração compartilhado no lançamento não fosse totalmente verdadeiro.

Apresentação do Google com ilustração azul mostrando as três versões do Gemini e sua complexidade.

Em primeiro lugar, o Gemini é multimodal, o que significa que pode aceitar avisos em qualquer combinação de texto, áudio e mídia visual. É como um superpoder, permitindo que a IA compreenda informações da mesma forma que um ser humano usaria todos os seus sentidos. Em segundo lugar, o Gemini está disponível em três tamanhos, por assim dizer – Nano, Pro e Ultra. O menor do lote está disponível imediatamente no Pixel 8 Pro, potencializando recursos como Resposta Inteligente no aplicativo Mensagens e resumos no aplicativo Gravador. O modelo intermediário, Gemini Pro, está disponível no Bard desde dezembro, fazendo a transição do chatbot do modelo LaMDA2 mais antigo.

Recursos com tecnologia de IA para dispositivos Google Pixel

Gemini desbloqueou resposta preditiva aprimorada no WhatsApp para usuários do Pixel 8 Pro e até permitiu a geração de resumos para transcrições gravadas. Eles não nos impressionaram aqui na AP, mas o Google raramente lança tecnologia perfeita imediatamente. Além disso, o Android 14 traz várias outras melhorias e recursos alimentados por IA que beneficiam dispositivos Pixel mais antigos compatíveis com a atualização. Aqui está uma rápida olhada em duas das melhores partes:

Composição mágica em mensagens

O Android 14 traz o poder da IA generativa para o Mensagens do Google. Usando esse recurso, você pode responder aos textos recebidos de forma bastante criativa. Tudo que você precisa para começar é um breve aviso resumindo a resposta pretendida e uma rápida seleção do tom para aquele talento criativo. A IA faz o resto, permitindo que você forneça respostas de Shakespeare em um instante, sem quebrar a cabeça com essas palavras complexas.

Magic Compose do Google Messages oferecendo sugestões de Shakespeare

Papéis de parede generativos de IA

A atualização para o Android 14 apresenta várias melhorias na área de personalização, desde papéis de parede emoji até papéis de parede cinematográficos semelhantes aos do iPhone, que aproveitam os dados de profundidade das fotos no modo retrato para criar um efeito de paralaxe usando os sensores giroscópios do dispositivo. O Google também oferece papéis de parede de IA generativos nesta versão, que usa um modelo de difusão de texto para imagem. Você só precisa escolher um tema, estilo artístico e paleta de cores para criar um papel de parede que se adapte perfeitamente à configuração da sua tela inicial.

O Google Workspace é onde está a ação

Todos os outros aspectos dos esforços de IA do Google são insignificantes em comparação com as adições demonstráveis ao seu conjunto de produtos Workspace. Somente em 2023, o Google apimentou aplicativos como Documentos, Planilhas e Apresentações com todas as combinações imagináveis dos recursos de IA mencionados acima. Isso é compreensível, porque todos esses recursos são empacotados coletivamente como Duet AI para Google Workspace, que custa US$ 30 por mês.

Ajude-me a escrever no Gmail e no Documentos

Usando um prompt no campo Ajude-me a escrever do Gmail.

O Google aprimorou o Gmail com Help Me Write, que despertou entusiasmo em resposta a uma demonstração no palco do I/O. O recurso permite que você elabore respostas completas a e-mails sem gastar muito tempo sozinho. Você só precisa de um breve aviso para começar, e a IA pode refinar o texto gerado para atender melhor às suas necessidades.

A mesma IA também está disponível no Google Docs e funciona da mesma maneira. No entanto, você não está limitado a redigir respostas ao e-mail que recebe. Em vez disso, você pode usar instruções especializadas para criar texto para praticamente qualquer tópico que precisar. A certa altura, porém, ficamos com a sensação de que o Google tinha muitos assistentes de composição de texto ativos simultaneamente.

Ajude-me a visualizar em slides

Uma animação do painel Help Me Visualize no Apresentações Google

Como o problema da composição é muito mais visual quando você cria apresentações no Planilhas, o Google lançou um assistente de IA chamado Help Me Visualize, que usa modelos de difusão de texto para imagem como Dall-E e MidJourney. Ele converte facilmente prompts textuais em imagens que você pode inserir em sua apresentação.

Ajude-me a organizar no Planilhas

O Planilhas Google é frequentemente usado para gerenciar grandes quantidades de dados numéricos, e a IA é excelente no processamento de números. Para aproveitar ao máximo essa vantagem, o recurso Help Me Organize do Google no Duet AI permite classificar dados em colunas e linhas automaticamente, derivar uma classificação numérica de comentários de texto de clientes, etc. lidar regularmente com grandes quantidades de dados.

IA no Google Meet

Se o aplicativo Recorder em telefones Pixel pode desfrutar de resumos, o Google Meet não pode ficar muito atrás. Duet AI adiciona suporte para resumo de reuniões junto com vários efeitos de iluminação e som. Os resumos podem ser úteis ao revisar as transcrições das notas da reunião ou apenas para economizar tempo participando dessas reuniões.

Dito isso, o Duet AI também pode extrair dados de vários aplicativos do Workspace vinculados à mesma conta do Google, simultaneamente. Por exemplo, ele pode pegar os números do Planilhas, destaques do Documentos e notas de reuniões do Meet e juntar tudo em uma apresentação impressionante do Slides, preparada para surpreender seu gerente. O Duet AI também está disponível para clientes do Google Cloud.

Menções dignas de nota

Embora a maioria dos produtos de IA voltados para o consumidor que o Google lançou se enquadrem em um dos segmentos acima, houve algumas criações curinga este ano. Eles têm um futuro promissor pela frente se o Google decidir continuar a desenvolvê-los.

Visualização imersiva no Google Maps

O que começou como rival da visualização 3D no Apple Maps agora é chamado de Visualização Imersiva no Google Maps. O recurso usa IA para criar representações 3D imersivas de lugares que você sempre sonhou em visitar, usando apenas imagens planas do local. Compreensivelmente, a disponibilidade é limitada a algumas cidades, mas é um caso de uso interessante para IA, onde a representação realista dos arredores pode ajudá-lo a planejar e navegar melhor. Até que a disponibilidade se expanda, porém, é apenas mais um sonho irrealizável de IA.

Fonte: Google

Editor de imagens

A IA já desempenha um papel importante no processo de edição de imagens para usuários do Google Fotos. No entanto, o pacote de edição do Imagen AI apresentado este ano praticamente redefine a edição sem esforço. Pense na conveniência do Bard combinada com a precisão do recurso Content-Aware Fill do Adobe Photoshop. O editor de imagens é especializado em edições localizadas que afetam apenas uma região definida da imagem. Depois que a máscara é definida, as instruções textuais são suficientes e a IA garante que a edição seja feita de maneira limpa, evitando o trabalho de usar um pente fino mais tarde. No entanto, não está imediatamente disponível ao público.

NotebookLM

Juntamente com a recente estreia do Gemini, o Google anunciou o NotebookLM, uma ferramenta de IA anteriormente chamada de Project Tailwind, alimentada pelo modelo Gemini Pro. Seu objetivo singular é simplificar a tomada de notas e a formatação do conteúdo das referidas notas. A IA pode ajudar os usuários a organizar notas aleatórias, graças à compreensão contextual e aos recursos de processamento de informações. Em teoria, o Google projetou isso apenas para estudantes, mas eles não são os únicos que planejam seus trabalhos e fazem anotações. NotebookLM pode beneficiar milhões se implantado em escala.

Entrando em 2024 com esperanças e preocupações

Embora todos estejam entusiasmados para ver as possibilidades da IA se desvendarem, existem vários limites que carecem de definição. Não é nenhum segredo que a IA utiliza grandes quantidades de dados para melhorar, e essa recolha de dados levanta questões de privacidade. Além disso, há um enorme risco de plágio e conteúdo não original, com o trabalho gerado por IA muito semelhante ao trabalho humano no qual é treinado – o Google chegou ao ponto de prometer proteger seus usuários diretamente de ações judiciais. As pessoas também podem transmitir conteúdo gerado por IA como se fosse seu, levantando ainda mais preocupações éticas. Embora a marca d’água de imagens e textos criados por IA possa ajudar, esperamos que empresas como o Google apoiem essas iniciativas.