O Google Gemini substituiu o Google Bard. Alguns se perguntam se Gemini é outro trampolim até que um modelo de IA melhor e mais poderoso surja para ocupar seu lugar. Aconteceu com Bard e Duet AI, e agora está acontecendo com o Google Assistant. Apesar de algum ceticismo menor, muitos acreditam que o Google Gemini é um divisor de águas para a produtividade em Chromebooks e aplicativos móveis de última geração.
Mas o que o Google Gemini faz melhor do que as outras IAs realizaram anteriormente? Aqui estão algumas dicas e truques para ajudá-lo a entender o LLM (modelo de linguagem grande) mais inovador do Google.
Entendendo o que o Google Gemini faz de melhor
O Google Gemini se diferencia da IA generativa inicial porque é um modelo multimodal desde o início. Em vez de inserir texto para conversar com a IA, você pode enviar outros formatos de saída, como imagens, áudio e vídeo.
Antes do lançamento público do Gemini, a Open AI lançou um modelo semelhante com o GPT-4 Vision. Mas os recursos multimodelos do GPT-4 Vision não funcionam no sentido mais verdadeiro como os do Gemini. Por exemplo, GPT-4V usa Whisper (outro modelo de aprendizagem) para lidar com a conversão rápida em texto. Por outro lado, o Google Gemini foi projetado para lidar sozinho com esses tipos de entrada.
Atualmente, a versão que mais temos acesso é a Gemini Pro. O Gemini Pro pode vencer o GPT-3.5, mas ainda é derrotado pelo GPT-4 (de acordo com testes acadêmicos usados para pontuar LLMs). Mas a promessa vem do Gemini Ultra (acessado através da assinatura do Gemini Advanced), que pode superar o GPT-4.
Google Gemini: tudo o que você precisa saber sobre a IA multimodal de última geração do Google
O Google Gemini está aqui, com uma abordagem totalmente nova para IA multimodal: aqui está o que você deve saber.
Peça ao Gemini uma análise de vídeo do YouTube
Muitos vídeos do YouTube têm muitas informações intercaladas entre seu conteúdo. Nem todos os criadores de conteúdo têm acesso a editores. Às vezes, os criadores têm patrocínios que exigem tempo de exibição do vídeo. Nada disso nos ajuda a aprender o assunto. É aqui que o Google Gemini se torna útil. Gemini tem um recurso YouTube Vision. Ao usar o comando @Youtube enquanto conversa com o Gemini, você pode pedir para ele analisar o conteúdo de um vídeo.
- Abrir Google Gêmeos por meio do aplicativo móvel oficial ou faça login no Google Gemini em um navegador da web.
- Dentro da caixa de prompt, digite @YouTube e selecione-o. Se você souber o nome do canal ou tiver o link direto em mãos, digite-o após o comando, por exemplo, Polícia Android do @YouTube.
Por padrão, o Gemini resume o vídeo para você e você pode fazer perguntas sobre o vídeo. Gêmeos ainda está aprendendo, então não espere que esse recurso funcione sempre perfeitamente.
Converse com Gêmeos usando imagens
Gemini é a IA generativa multimodelo do Google, capaz de criar vários tipos de resultados, incluindo imagens. Existe uma limitação para o Gemini ao gerar imagens. Não pode criar imagens de pessoas. O Google pausou esse recurso até que possa implementar melhorias na capacidade da IA de representar pessoas em fotos. Gêmeos demonstrou preconceito racial ao reproduzir imagens com pessoas.
Apesar dessa limitação, você pode fazer bastante com o gerador de imagens e a ferramenta de reconhecimento integrados do Gemini. Você pode pedir ao Gêmeos para criar uma imagem apenas usando texto ou fazer upload de uma de sua preferência e fazer perguntas, como qual é o padrão da toalha de mesa sobre a qual a comida está colocada? Veja como isso é feito:
- Abrir Google Gêmeos por meio do aplicativo móvel oficial ou faça login no Google Gemini em um navegador da web.
- Selecione os ícone de imagem dentro da caixa de prompt.
- Escolha uma foto para enviar.
- Digite uma pergunta dentro da caixa de prompt e selecione Enviar (ícone de seta).
Da próxima vez que você não souber o que é algo, faça upload de uma imagem para o Google Gemini. Ou adquira ideias para um projeto de arte pedindo a Gêmeos que encontre alguns exemplos de imagens.
Pratique programação usando o Google Gemini
Como parte dos recursos LLM do Gemini, conseguir que o Gemini ajudasse na codificação sempre foi uma vantagem. Você pode usar o Gemini para verificar uma linha de código ou solicitar que ele produza uma.
- Abrir Google Gêmeos por meio do aplicativo móvel oficial ou faça login no Google Gemini em um navegador da web.
- Insira uma solicitação ou comando e selecione Enviar.
Gêmeos pode mostrar apenas trechos.
Se você assinar o Gemini Advanced, poderá executar e editar o código Python dentro da interface do Gemini. Este recurso ajuda os desenvolvedores a verificar se as linhas de código se comportam conforme o esperado. Se for necessário fazer modificações, peça ao Gemini para verificar novamente o envio.
Crie Planilhas Google com Gemini
Precisa de ajuda para organizar informações? Criar Planilhas Google pode ser um incômodo, especialmente para resolver tarefas simples. É aqui que entra Gêmeos. Dê instruções a Gêmeos e peça-lhe que faça uma mesa.
- Abrir Google Gêmeos por meio do aplicativo móvel oficial ou faça login no Google Gemini em um navegador da web.
- Digite uma solicitação dentro da caixa de prompt e selecione Enviar.
- Na parte inferior da tabela (se aplicável), escolha Exportar para planilhas.
Parte dos benefícios da integração do Gemini ao Google Workspace inclui a criação de esboços e planos de projetos para você. Talvez um colega de trabalho tenha enviado a você uma planilha de dados brutos que é difícil de analisar. Peça ajuda ao Gemini para reformatar os dados.
Peça ajuda à tradução para Gêmeos
A IA do Google é especializada em tradução de idiomas. Você pode pedir a Gêmeos que traduza um ditado ou copie um documento para outro idioma. Também considera o contexto e o tom para traduções melhoradas (aquelas que soam mais naturais). Gemini parece ser mais consistente com a tradução do que outras IAs baseadas em LLM.
- Abrir Google Gêmeos por meio do aplicativo móvel oficial ou faça login no Google Gemini em um navegador da web.
- Digite uma solicitação dentro da caixa de prompt e selecione Enviar.
Usando Gêmeos para adicionar humor a qualquer assunto
Você pode se divertir usando o Google Gemini. Você pode precisar digerir informações complexas sobre um tópico desafiador, mas os métodos convencionais não funcionam. Peça ao Google Gemini para transformar um resumo de tópico em uma música rap (ou poema).
- Abrir Google Gêmeos por meio do aplicativo móvel oficial ou faça login no Google Gemini em um navegador da web.
- Insira uma solicitação na caixa de prompt e certifique-se de incluir “em um poema” ou “em uma música” na solicitação.
A chave para estudar um tópico árido é, às vezes, remontar a forma como ele foi apresentado. Não tenha medo de ser criativo com isso.
Cresça mais com Gemini Advanced
Se você gosta de sua experiência com o Google Gemini e deseja mais da IA, considere atualizar para o Gemini Advanced. Gemini Ultra (a versão que você recebe com Gemini Advanced) ajuda a decodificar e criar códigos mais avançados enquanto leva a criação de conteúdo para o próximo nível (analisando tendências e debatendo ideias). Também pode ser um tutor pessoal em vez de uma IA especializada em ajuda com trabalhos de casa.
Tudo no Gemini Ultra o torna mais carregado no que pode fazer. Você pode experimentar assinando um plano do Google One, que também oferece suas próprias vantagens. Caso contrário, pegue o aplicativo móvel abaixo e comece a conversar com o Gemini Pro.