O Google está finalmente consertando uma das coisas mais frustrantes sobre a geração de imagens de IA do Gemini

Principais conclusões

  • A versão beta mais recente do Google app oferece novas opções de redimensionamento de imagens do Gemini.
  • Existem grandes preocupações éticas sobre a utilização da IA ​​nos setores criativos, especialmente no que diz respeito a questões de direitos de autor.
  • O Google Gemini está em quase todos os aplicativos do Google Workspace.




O Google Gemini é um dos maiores novos players, se não o maior recém-chegado, ao cenário da inteligência artificial de 2024. É a tentativa do Google de expandir sua empresa líder em vários setores em outro domínio, e está fazendo isso trazendo o Gemini para praticamente todos os setores. aplicativo no Google Workspace. Embora a IA seja certamente fixe, representa uma realidade horrível para muitos nos sectores criativos, uma vez que as questões éticas sobre a forma como a IA é treinada se cruzam com questões de direitos de autor e disputas de remuneração justa. Imagen 3, o gerador de texto para imagem do Google, está diretamente envolvido neste debate, mas o Google disse que irá defendê-lo se suas imagens de IA infringirem seus direitos autorais. Não importa o debate em curso; A experiência do usuário de criação de imagens do Gemini está cada vez melhor e agora oferece mais opções de personalização aos seus usuários.


Relacionado

ARTIGO: Google atualiza Gemini com o modelo de geração de imagens do aplicativo Pixel Studio

A imagem 3 está aqui

Desde que você possa gerar imagens usando o Gemini, o denominador comum entre o Imagen 3 e o Imagen 2 tem sido suas saídas de tela quadrada. Isso deve mudar em uma próxima versão estável do Google app, já que o Android Authority relata que, na versão 15.41.34.29.arm64 beta, agora existem configurações no aplicativo para redimensionar imagens do Gemini. Também não parece uma ferramenta simples de cortar e redimensionar; o site informa que o Gemini adicionará mais detalhes de fundo ao cortar e preencherá os espaços em branco ao aumentar as imagens.


O ano movimentado de Gêmeos na geração de imagens

gemini-image-resizing-1-android-authority

(Fonte: Autoridade Android)


Há muita coisa acontecendo nos bastidores do Google com as ferramentas de criação de imagens do Gemini, e o Imagen 3 está ficando mais inteligente a cada dia. A terceira versão do Imagen foi lançada em agosto e melhorou a compreensão imediata do Imagen 2 e adicionou uma opção de saída de quatro imagens chamada Imagen 3 Fast. Uma deficiência (ou algo que deveríamos nos alegrar como sociedade) é que Gêmeos não consegue gerar imagens de pessoas. O Google admitiu que os recursos de geração de imagens do Gemini “erraram o alvo” no início e, embora imagens de pessoas ainda não possam ser geradas, achamos que está tudo bem.

O Imagen 3 se infiltrou em muitos aplicativos diferentes do Google, como o Apresentações. Os usuários não precisam sair dos limites de seu modelo para criar imagens de IA na nuvem, mas precisam ter uma conta Enterprise ou Education ou acesso ao Google Workspace Labs. Contas pessoais podem obter acesso ao recurso assinando o Google One AI Premium. Além do Apresentações, o aplicativo Capturas de tela do Google Pixel 9 finalmente conseguiu a integração Gemini que deveria ter tido o tempo todo.