O Google Veo supera o OpenAI Sora com um gerador de vídeo que está realmente disponível

Principais conclusões

  • O gerador de vídeo de IA do Google, Veo, está agora em versão prévia privada para clientes do Google Cloud.
  • Veo está sendo comercializado para anunciantes por fazer anúncios mais baratos e rápidos.
  • Imagen 3, o gerador de texto para imagem atualizado do Google, também estará disponível para todos os clientes do Google Cloud na próxima semana.




Em 2023, geradores de imagens de IA como Midjourney e Stable Diffusion eram impressionantes, mas se tornaram coisa do passado quando a OpenAI lançou o Sora, seu gerador de vídeo de IA. A startup revelou o Sora em fevereiro de 2024, mas não compartilhou nenhuma atualização significativa sobre seu cronograma de lançamento desde então. O Google, no entanto, já disponibilizou seu gerador de vídeo AI Veo aos clientes, apesar de revelá-lo três meses após o OpenAI em sua conferência de desenvolvedores em junho.

Relacionado

Um navegador com tecnologia ChatGPT poderá em breve atingir a supremacia do Chrome

Prepare-se para ser raspado


O Google anunciou na terça-feira que Veo, sua ferramenta de IA para fazer pequenos videoclipes a partir de imagens e prompts, agora está disponível em visualização privada para clientes que usam Vertex AI, a plataforma de IA do Google Cloud (via The Verge). Veo pode produzir vídeos 1080p em diferentes estilos visuais e cinematográficos com base em prompts de texto ou imagem. Não está claro quanto tempo os vídeos podem durar. No lançamento, o Google sugeriu que teriam cerca de um minuto de duração, mas não mencionou nenhum limite de duração para esta versão prévia.

O Google está lançando o Veo aos anunciantes como uma forma de tornar os anúncios mais rápidos e baratos. Empresas como Mondelez International (dona da Oreo), WPP e agência de viagens Agoda já estão usando Veo para criar conteúdo de marketing. O Google até compartilhou um exemplo de como a equipe da Agoda usou o Veo para fazer um vídeo promocional e… bem, ainda não chegou lá. Os vídeos parecem semi-realistas, o que pode funcionar para alguns anunciantes, mas qualquer pessoa séria em seu jogo de marketing pode querer adiar os geradores de vídeo de IA por enquanto.



A versão mais recente do Imagen 3 do Google também está aqui

O Google anunciou que a versão mais recente de seu gerador de texto para imagem Imagen 3 também estará disponível para todos os clientes do Google Cloud via Vertex a partir da próxima semana. Isso expande seu lançamento original apenas nos EUA por meio do AI Test Kitchen do Google em agosto. Os usuários na lista de permissões do Google também terão acesso a novos recursos, como edição de fotos com base em prompts e a capacidade de adicionar sua própria marca, estilo, logotipo ou recursos de produto às imagens geradas.

O Google afirma que o Imagen 3 cria imagens mais realistas e de alta qualidade a partir de instruções de texto simples, com melhores detalhes, iluminação e menos artefatos do que as versões anteriores. As imagens parecem bastante realistas à primeira vista, mas se você olhar de perto, verá que ainda há muito trabalho a ser feito.


Relacionado

A ferramenta de marca d’água de IA do Google DeepMind torna-se código aberto

Lutando para separar o humano da máquina