A ferramenta de marca d’água AI do Google DeepMind está pronta para enfrentar deepfakes

Principais conclusões

SynthID ajuda a identificar conteúdo gerado pelo Google Gemini e potencialmente outros modelos de IA.
A ferramenta altera sutilmente as previsões para marcar o texto com base em diferenças mínimas e mensuráveis entre a saída prevista e a real.
O código aberto do SynthID da DeepMind incentiva a adoção em todo o setor, promovendo a identificação de conteúdo de IA.

O conteúdo atribuído erroneamente a escritores humanos tem aumentado desde que LLMs modernos e poderosos tornaram o Teste de Turing obsoleto. Além de ferramentas semelhantes para identificar imagens, músicas e vídeos gerados por IA, a subsidiária de pesquisa DeepMind AI do Google acaba de lançar a versão beta do SynthID, um método de marca d’água e identificação de texto criado usando o modelo Gemini. Melhor ainda, a ferramenta é de código aberto, para que outras empresas de IA possam utilizá-la para acompanhar o que seus modelos criam.

Acompanhando os robôs

Uma assinatura imperceptível de cada vez

Uma captura de tela do vídeo promocional do DeepMind SynthID com palavras destacadas no texto

Fonte: Google DeepMind

As técnicas implementadas anteriormente pela DeepMind anexam imagens, vídeo e áudio com marcas d’água indetectáveis pelos olhos e ouvidos humanos. Os pesquisadores desenvolveram algo um pouco diferente que permite ao SynthID assinar texto gerado pelo LLM.

Ele funciona alterando a saída probabilística do modelo ou alterando levemente quais palavras provavelmente funcionarão melhor em uma determinada passagem de texto. Com base na diferença entre a saída de palavras prevista do LLM e o que o algoritmo modificado produz, a ferramenta pode identificar com segurança se o conteúdo foi escrito pelo Google Gemini.

Foto de um outdoor digital lendo em Las Vegas

Relacionado

Como usar o Google MusicFX para criar músicas geradas por IA

Crie músicas instrumentais com apenas um prompt de texto

Claro, não pode alterar o conteúdo demaisou as habilidades de linguagem bruta do modelo serão prejudicadas. Para garantir que o SynthID não fosse longe demais, os pesquisadores o submeteram a um teste massivo. Eles enviaram cerca de 20 milhões de passagens geradas pelo Gemini aos usuários, algumas com e outras sem marcas d’água.

Os resultados indicaram que os usuários consideraram o texto com marca d’água e não afetado igualmente preciso e útil, ou em essência, indistinguível. Também não afetou a velocidade do LLM de forma perceptível.

Pressionando por suporte em todo o setor

A DeepMind não para de rotular apenas os resultados do Google Gemini. A marca d’água e a detecção SynthID já foram de código aberto e oferecidas aos desenvolvedores de outros modelos de IA, para incentivar sua adaptação para uso com os muitos LLMs concorrentes de hoje.

Como toda ferramenta de detecção de IA (e muitas técnicas de quebra de criptografia), o SynthAI poderia dar aos desenvolvedores de IA inescrupulosos outro meio de praticar como ofuscar as origens do LLM de um texto. Como subsidiária do líder mundial em coleta de dados (ou seja, Google), o envolvimento da DeepMind significa que há recursos significativos em jogo para garantir que o conteúdo de IA seja prontamente identificável como tal.