O Google atualiza o Gemini com o modelo de geração de imagens do aplicativo Pixel Studio

Principais conclusões

  • Os aplicativos iniciais de IA, como chatbots e geração de imagens, ajudaram a popularizar aplicativos como ChatGPT e Midjourney.
  • O Google agora oferece integrações profundas de IA em seus aplicativos e assistente de chatbot Gemini para geração de imagens, entre outras coisas.
  • Imagen 3 no Gemini agora oferece acesso gratuito a modelos realistas de texto para imagem, mas pode parecer um desserviço para os compradores recentes de Pixel.




A IA continua evoluindo, mas apenas algumas aplicações iniciais cativaram as massas – interações no estilo chatbot e geração de imagens a partir de prompts textuais. Esses fatores por si só ajudaram empresas como ChatGPT e Midjourney a disparar em popularidade. Agora, o Google tem várias integrações profundas de IA em seus aplicativos, bem como um assistente de chatbot chamado Gemini, que também pode lidar com a geração de imagens, tornando-o um de nossos aplicativos de IA favoritos para Android. A empresa recentemente deu um impulso às habilidades de geração de imagens do Gemini.

Relacionado

Pixel Studio está pronto para usar sua mágica de IA em imagens de aplicativos que você realmente usa

Maneiras mais fáceis de ser estúpido


O Google retirou o Imagen 3 no I/O no início deste ano, e a ferramenta desde então tem sido usada nos bastidores de aplicativos como o Pixel Studio. Ele permite que os usuários solicitem à IA que gere imagens e, em seguida, refinem seletivamente o resultado em múltiplas iterações. O aplicativo parece funcionar bem com imagens de pessoas, mas foi limitado à série Pixel 9 mais recente. Uma recente visita ao serviço Gemini na web revelou que o serviço também dá acesso ao Imagen 3, mesmo no nível gratuito (via NotebookCheck).

O Google vem testando o Imagen 3 no Gemini nos últimos meses, por meio do AI Test Kitchen. Após alguns meses de testes, a empresa parece ter decidido dar a todos os usuários acesso a esses recursos de geração de imagens, pois estamos vendo um pop-up sobre isso no Gemini. Embora o aplicativo Pixel Studio tenha convertido as definições estilísticas de seu prompt em menus suspensos com alternativas, a implantação do Google no Gemini se concentra na nitidez da imagem, nos detalhes e em mais fotorrealismo do que o modelo anterior.



O progresso rápido pode parecer um desserviço para os clientes pagantes

Google-imagen-3-em-Gêmeos

Por um lado, o acesso gratuito ao principal modelo de texto para imagem do Google com realismo surpreendente é uma grande vantagem. Por outro lado, há um número diferente de zero de clientes que compraram a série Pixel 9 para aproveitar a conveniência do aplicativo Pixel Studio . O telefone não tem nem um ano neste momento, e o Google tornar o Imagen 3 tão facilmente acessível pode parecer um desserviço para os compradores de Pixel que desembolsaram dinheiro de verdade pela inteligência da IA.

No entanto, dada a rápida taxa de avanços na IA, não estamos surpresos que o Google esteja feliz em oferecer o Imagen 3 gratuitamente às massas, embora provavelmente funcione em um modelo generativo diferente com melhores capacidades para a próxima geração. Nesses casos, há um forte argumento para chamar esses recursos de “bloatware” nos telefones se eles estiverem disponíveis gratuitamente poucos meses depois.


Dito isso, o Imagen 3 no Gemini é um avanço para as pessoas que usam o chatbot para criar imagens para uma apresentação universitária ou apenas memes para manter o bate-papo em grupo animado.