Resumo
- Whisk é um novo gerador de imagens do Google que torna a criação de imagens de IA simples e fácil.
- Whisk utiliza Gemini AI e Imagen do Google para converter imagens enviadas em prompts de texto detalhados para criação de IA.
- Whisk é uma ferramenta de brainstorming para exploração visual, permitindo rápida iteração através de uma variedade de ideias em minutos.
O Google revelou hoje sua mais recente ferramenta de IA. Desta vez é um gerador de imagens chamado Whisk, mas funciona de maneira um pouco diferente da maioria dos geradores de imagens de IA. O Whisk permite inserir outras imagens como prompts e misturá-las para criar uma imagem totalmente nova.
Relacionado
5 razões pelas quais a IA do Google está muito à frente da inteligência da Apple
Até comparar os dois parece injusto
Ao contrário de outros geradores de imagens, que exigem instruções de texto cuidadosamente redigidas, o Whisk torna o processo de geração de uma imagem de IA bastante simples. Basta arrastar e soltar as imagens na ferramenta e ela fará o resto.
Veja como funciona o Whisk AI
Whisk é desenvolvido com Gemini AI e Imagen do Google, sua ferramenta de IA de criação de imagens. Gemini funciona em segundo plano, convertendo as imagens que você carrega em prompts de texto detalhados para o modelo de IA. O Google explicou assim:
Legendagem automática: o Gemini primeiro cria prompts detalhados com base nas imagens que você carrega.
Remixagem generativa: Os prompts são inseridos no Imagen 3 para criar resultados inspirados em suas imagens de entrada.
Prompts editáveis: Você pode ajustar os prompts de imagem gerados para refinar os resultados.
O processo produz o que o Google chama de “essência” de uma imagem, em vez de uma réplica exata. Como resultado, os resultados podem variar amplamente, com detalhes como altura, tom e tamanho mudando. Isso torna o Whisk uma ótima ferramenta de brainstorming, mas meio inútil como gerador artístico de imagens de IA.
O Google diz que o Whisk é para “exploração visual rápida” e permite que artistas e criativos repitam dezenas de ideias em questão de minutos. É mais uma ferramenta de brainstorming do que uma máquina de saída com pixels perfeitos. Mas é rápido e flexível.
Veja como você pode experimentar o Whisk AI
Fonte: Batedor
Whisk pode ser acessado através do Google Labs. Você pode testar a ferramenta e compartilhar feedback com o Google. Whisk é atualmente um projeto experimental divertido, então não há informações sobre quando ou se ele será lançado no mercado.
Atualmente, o Whisk está disponível apenas para pessoas com endereço IP nos Estados Unidos.
Esta é mais uma ferramenta de IA do Google, mas pode ser útil. O uso de imagens em vez de prompts de texto detalhados nivela o campo de jogo para muitas pessoas que não têm tempo para aprender a intrincada engenharia de prompts de IA. Mas agora nos perguntamos o que acontecerá quando Imagens de IA estão gerando imagens de IA.