O novo Whisk AI do Google permite inserir imagens como solicitações para criar novas imagens

Resumo

  • Whisk é um novo gerador de imagens do Google que torna a criação de imagens de IA simples e fácil.
  • Whisk utiliza Gemini AI e Imagen do Google para converter imagens enviadas em prompts de texto detalhados para criação de IA.
  • Whisk é uma ferramenta de brainstorming para exploração visual, permitindo rápida iteração através de uma variedade de ideias em minutos.




O Google revelou hoje sua mais recente ferramenta de IA. Desta vez é um gerador de imagens chamado Whisk, mas funciona de maneira um pouco diferente da maioria dos geradores de imagens de IA. O Whisk permite inserir outras imagens como prompts e misturá-las para criar uma imagem totalmente nova.

Relacionado

5 razões pelas quais a IA do Google está muito à frente da inteligência da Apple

Até comparar os dois parece injusto

Ao contrário de outros geradores de imagens, que exigem instruções de texto cuidadosamente redigidas, o Whisk torna o processo de geração de uma imagem de IA bastante simples. Basta arrastar e soltar as imagens na ferramenta e ela fará o resto.



Veja como funciona o Whisk AI

Uma morsa rosa contra um céu azul, com um cartão amarelo e as palavras Assunto, Cena, Estilo em preto.

Whisk é desenvolvido com Gemini AI e Imagen do Google, sua ferramenta de IA de criação de imagens. Gemini funciona em segundo plano, convertendo as imagens que você carrega em prompts de texto detalhados para o modelo de IA. O Google explicou assim:

Legendagem automática: o Gemini primeiro cria prompts detalhados com base nas imagens que você carrega.

Remixagem generativa: Os prompts são inseridos no Imagen 3 para criar resultados inspirados em suas imagens de entrada.

Prompts editáveis: Você pode ajustar os prompts de imagem gerados para refinar os resultados.

O processo produz o que o Google chama de “essência” de uma imagem, em vez de uma réplica exata. Como resultado, os resultados podem variar amplamente, com detalhes como altura, tom e tamanho mudando. Isso torna o Whisk uma ótima ferramenta de brainstorming, mas meio inútil como gerador artístico de imagens de IA.


O Google diz que o Whisk é para “exploração visual rápida” e permite que artistas e criativos repitam dezenas de ideias em questão de minutos. É mais uma ferramenta de brainstorming do que uma máquina de saída com pixels perfeitos. Mas é rápido e flexível.

Veja como você pode experimentar o Whisk AI

Uma imagem gerada por IA de um boneco de neve gigante servindo bebidas para hóspedes em trajes de banho sentados em um bar em uma praia tropical.

Fonte: Batedor

Whisk pode ser acessado através do Google Labs. Você pode testar a ferramenta e compartilhar feedback com o Google. Whisk é atualmente um projeto experimental divertido, então não há informações sobre quando ou se ele será lançado no mercado.

Atualmente, o Whisk está disponível apenas para pessoas com endereço IP nos Estados Unidos.


Esta é mais uma ferramenta de IA do Google, mas pode ser útil. O uso de imagens em vez de prompts de texto detalhados nivela o campo de jogo para muitas pessoas que não têm tempo para aprender a intrincada engenharia de prompts de IA. Mas agora nos perguntamos o que acontecerá quando Imagens de IA estão gerando imagens de IA.