7 coisas que aprendi usando imagens geradas por IA pela primeira vez

Os geradores de imagens de IA são incríveis, mas não são muito inteligentes. Eles produzem resultados inacreditáveis ​​​​com esforço zero. É como tirar fotos com os melhores telefones com câmera. Eles também gostam de mostrar sua incapacidade de contar. Estas são observações que fiz durante meu primeiro encontro com imagens generativas de IA. Testei 10 deles em busca de um favorito e foi tão divertido quanto parece.



Enquanto procurava o melhor gerador de imagens de IA, aprendi muito sobre eles. Percebi peculiaridades, me deparei com problemas, tropecei em dilemas morais e entrei em tocas de coelho que nem suspeitava que existissem. Isso mudou a forma como vejo a criação de imagens de IA e gostaria de compartilhar minhas impressões com você.


Relacionado

Como identificar imagens geradas por IA

Não se deixe enganar por deep fakes nas redes sociais


7 As imagens de IA não precisam ser perfeitas para serem úteis

Especialmente se você tiver Photoshop

imagem ai de um eletricista fazendo manutenção em uma tomada em uma sala vazia

Fonte da imagem: Microsoft Designer

Você consegue identificar o erro nesta imagem gerada por IA?

Eu esperava que as imagens de IA fossem sempre imaculadas, mas a realidade me surpreendeu. De vez em quando, as imagens incluíam imperfeições óbvias, considerando-as geradas por IA. Percebi que isso pode ser qualquer coisa, desde padrões e texturas mal renderizados até pessoas com dedos extras ou em posições não naturais.

Percebi que imagens defeituosas poderiam ser úteis em algumas aplicações. As falhas não eram visíveis quando a imagem de saída foi reduzida. As falhas também importam menos se a imagem não estiver no foco do meu conteúdo ou se não for vista por ninguém além de mim. Aqui estão alguns exemplos de como tenho usado imagens geradas por IA desde então, tanto para diversão quanto no trabalho:


  • Faça colagens e miniaturas de vídeos do YouTube. Nesses casos, reduzo o tamanho da imagem gerada pela IA ou a uso como parte de um design maior.
  • Gere recursos visuais de apresentação de slides que correspondam ao tema do conteúdo.
  • Faça clip-arts e planos de fundo para vídeos e animações.
  • Visualize ideias como arranjos de ambientes, combinações de cores ou materiais e conceitos de produtos que posso fazer em minha oficina.

Quando uma imagem não atende às suas necessidades, edite partes dela ou peça uma nova à IA.

6 As imagens de IA não precisam ser perfeitas para causar problemas

Nem todos conseguem identificar arte gerada por computador

Um entusiasta da tecnologia pode estar familiarizado com a mídia gerada por IA. Eles também podem saber como reconhecer imagens feitas por IA. Mas o primo deles não hesita e não hesitaria em compartilhar esse conteúdo com o clube do livro.


“Descobrimos que a mídia gerada com métodos de última geração tornou-se virtualmente indistinguível da mídia ‘real’. Em todos os países e todos os tipos de mídia, as pessoas classificaram as amostras geradas por IA como tendo maior probabilidade de serem produzidas por um ser humano do que uma máquina”, afirma uma pesquisa realizada entre 3.000 pessoas em 2022.

Surpreendentemente, mesmo as imagens que posso facilmente identificar como geradas por IA parecem convincentes e influenciam pessoas inocentes, a julgar por alguns dos comentários que vejo online. Isso é preocupante, pois cria potencial para uso indevido. Atores mal-intencionados podem aumentar páginas de mídia social usando mídia controversa de IA para arrecadar curtidas, comentários e seguidores. Quando essas páginas são grandes o suficiente, elas podem ser aproveitadas para fins obscuros.

5 Os geradores de imagens nem sempre são inteligentes

Não tenho certeza se devo rir ou chorar com essas alucinações


A IA pode produzir imagens estranhas porque não entende física, anatomia, etiqueta ou o que um encanador faz. Acima estão os exemplos mais idiotas que recebi durante meus testes, mas as surpresas não pararam por aí.

Fiquei chocado ao perceber que os geradores de imagens de IA, por mais incríveis que sejam, podem não conseguir processar instruções que uma criança de 3 anos entenderia. Os resultados variam de um gerador para outro, mas é comum que a IA não consiga processar instruções relacionadas ao posicionamento ou orientação de objetos. Imagine desenhar um objeto à esquerda ou à direita de outro.

A contagem também é um desafio para os geradores de imagens de IA. A IA pode errar quando você solicita mais de três coisas. As imagens, incluindo texto, provavelmente terão letras extras ou faltando ou as palavras podem não fazer sentido. No entanto, existe pelo menos um gerador de imagens que renderiza o texto de maneira confiável. Isso me leva ao próximo ponto.

4 Cada gerador de imagens de IA tem seus prós e contras

Não é apenas uma questão de qual é o melhor

uma captura de tela da página inicial do Adobe Firefly

Fonte: Adobe


Joguei com mais de 10 geradores de imagens de IA. Embora o Google Gemini seja meu favorito, mudo para outras ferramentas de IA para algumas solicitações porque todas têm seus pontos fortes e limitações.

O Gemini, por exemplo, é gratuito, simples de usar e costuma produzir ótimos resultados. Porém, renderizar pessoas requer assinatura paga e não gera imagens de crianças. Adobe Firefly possui controles que permitem definir parâmetros como estilo ou intensidade visual, e sua capacidade de usar uma imagem de referência pode ser útil. Por outro lado, luta com imagens de pessoas. Se você precisar de texto em sua imagem, o Ideogram supera essas IAs de renome.

Pode ser necessário experimentar vários geradores de imagens de IA para ver qual melhor atende às suas necessidades. Não presuma que eles são iguais porque parecem idênticos.

3 Usar o prompt de texto ideal ajuda

Quanto mais específico você for, melhor

baixar imagens do Craiyon


A IA pode interpretar suas solicitações de texto. No entanto, ele (ainda) não consegue ler sua mente, então não produz exatamente o que você está imaginando. Ainda assim, você pode obter resultados mais próximos do que tem em mente. Você deve ser mais específico e fornecer um prompt bem estruturado.

Qual é a aparência de um prompt ideal? Depende da ferramenta de IA que você usa. Em qualquer caso, um breve aviso deixa espaço para improvisação por parte da IA. No entanto, a IA produz uma imagem mais precisa quando você fornece mais detalhes com uma boa estrutura. Os prompts podem ser surpreendentemente longos. Trust Insights tem um guia em PDF que compartilha as melhores práticas e fornece exemplos de prompts personalizados para geradores de imagens de IA populares.

2 A geração de imagens de IA consome muita energia

Então, os gigantes da tecnologia estão se tornando nucleares

geração de imagens do Google Gemini em um telefone na mão


Algumas implementações leves de IA são executadas localmente e processadas pelo NPU em seu telefone ou PC. A geração de imagens raramente é um deles. Se você solicitar uma imagem ao Google Gemini, sua solicitação será processada por um servidor remoto, o que requer muito poder de processamento.

Quanto poder? Uma estimativa recente do The Verge afirma que a geração de uma única imagem pode consumir tanta energia quanto a bateria de um smartphone típico. Não é surpresa que grandes gigantes da tecnologia como Meta, Amazon e Google estejam a recorrer à energia nuclear para satisfazer as exigências energéticas dos seus projectos de IA. Este é um dos motivos pelos quais as ferramentas de IA geralmente são pagas. Outros motivos são a infraestrutura e o treinamento do modelo de IA necessários para manter o serviço.

ai imagem de Sonic the Hedgehog e Super Mario apertando as mãos
Fonte: Google Gêmeos

Ensinar um modelo de IA para gerar imagens requer treiná-lo com dados. Grandes quantidades de dados de qualidade produzem melhores modelos de IA. De onde vêm esses dados? Mesmo que esses dados estejam disponíveis publicamente online, é discutível se os modelos de IA devem ser treinados neles.


Muitas das imagens que vemos online são feitas por pessoas que ganham a vida com isso, como artistas e fotógrafos. Treinar uma IA para recriar objetos, cenas, composições e estilos pode ser antiético. Os criadores originais não são compensados ​​por ajudarem indiretamente a criar uma ferramenta que possa substituí-los.

Para piorar a situação, a IA generativa pode violar os direitos de propriedade intelectual. No momento em que este livro foi escrito, Gemini não hesitaria em criar uma imagem de Sonic the Hedgehog apertando a mão de Super Mario.

À medida que a popularidade das ferramentas de IA cresce, também aumenta o número de ações judiciais e casos controversos em torno dessas áreas cinzentas.

A IA é poderosa, ainda mais quando você é bom em usá-la

Algumas das melhores imagens geradas por IA que fiz com o Google Gemini.


É fácil superestimar as capacidades dos geradores de imagens de IA quando você vê uma galeria de resultados escolhidos a dedo. Também é fácil ir na outra direção e subestimar a IA quando você se depara com suas falhas e limitações.

A IA generativa veio para ficar de uma forma ou de outra. Depois de semanas usando geradores de imagens de IA para várias tarefas, eu os vi não como substitutos completos para mim como criador, mas como companheiros. Eles podem estabelecer as bases e preencher os detalhes do meu trabalho criativo ou me tirar de uma rotina criativa.

Os geradores de imagens de IA não substituirão os artistas humanos tão cedo. No entanto, os humanos devem adaptar-se à vida com IA, o que irá melhorar. Você pode se atualizar sobre outras ferramentas de IA com nossos guias detalhados de IA do Google Gemini e Samsung Galaxy.