Resumo
- Há muitas questões em torno dos dados de treinamento do Sora da OpenAI.
- O CTO da OpenAI não tinha certeza sobre os dados de treinamento quando foi entrevistado no mês passado.
- O CEO do YouTube deixou claro que os vídeos da plataforma não devem ser usados para treinamento de dados pela OpenAI.
Embora o entusiasmo em torno do ChatGPT da OpenAI tenha diminuído consideravelmente desde seu lançamento inicial, a empresa não está descansando sobre os louros de forma alguma e realmente conseguiu “impressionar” a Internet alguns meses atrás com a introdução de seu texto para -modelo de vídeo apelidado de Sora. Pelo que vimos até agora, a tecnologia é absolutamente incrível, capaz de produzir vídeos realistas que realmente poderiam fazer alguém acreditar que são reais.
O que é OpenAI?
OpenAI está iniciando a revolução da IA com projetos ousados e alianças visionárias
Embora os bate-papos, imagens e filmes que podem ser produzidos por prompts sejam surpreendentes, há um lado negro que veio à tona com esse movimento recente, já que esses sistemas não apenas os criam do nada, mas, em vez disso, dependem de toneladas de dados para seu treinamento. Isso pode vir na forma de imagens, vídeos e até artigos. E embora algumas fontes sejam apropriadas para este tipo de uso, outras não o são. E é aí que algumas empresas estão tendo problemas, pois não está totalmente claro de onde vêm os dados de treinamento.
O CTO da OpenAI não está claro se Sora é treinado no YouTube e outras plataformas sociais
Talvez o mais alarmante seja o fato de Mira Murati, CTO da OpenAi, quando entrevistada pelo The Wall Street Journal no mês passado, não ter certeza ou clareza sobre a origem dos dados de treinamento de Sora (via Engadget). E embora não esteja claro se os vídeos do YouTube foram ou estão sendo usados para treinamento, o CEO do YouTube, Neal Mohan, talvez tenha dado um tiro certeiro, emitindo um aviso à OpenAI de que o uso de vídeos em sua plataforma não é permitido.
A proclamação vem de uma entrevista com Emily Chang no Bloomberg Originals, onde Mohan afirmou: “Não permite o download de coisas como transcrições ou bits de vídeo, e isso é uma clara violação de nossos termos de serviço. Essas são as regras do estrada em termos de conteúdo em nossa plataforma.” A empresa-mãe do YouTube, Google, também tem trabalhado em sua própria IA multimodal chamada Gemini, que também depende de dados de treinamento, mas Mohan afirmou que “o Google adere aos contratos individuais do YouTube com os criadores antes de decidir se deseja usar vídeos da plataforma”.
Será interessante ver se a OpenAI algum dia responderá e esclarecerá exatamente como está treinando o Sora, o que poderá eventualmente ser necessário se pretender permitir ao público o uso de suas ferramentas. É claro que as coisas continuarão a evoluir a partir daqui e, embora haja muitas incertezas envolvidas, também traz muitas possibilidades interessantes.