Qual ferramenta de IA é a mais precisa?

A ascensão de modelos generativos de IA na indústria tecnológica tem sido rápida e inegável. A tendência começou com o anúncio do ChatGPT-3 pela OpenAI, apoiado pela Microsoft, no final de 2022. A introdução do ChatGPT tomou o mundo de assalto e forçou o Google a lançar uma versão inicial de seu modelo de IA em 21 de março de 2023. Foi assim que obtivemos Bard, O primeiro modelo generativo baseado em chat do Google disponível publicamente.



ChatGPT e Google Bard receberam atualizações frequentes ao longo de 2023 com melhor disponibilidade, suporte a idiomas e recursos avançados. OpenAI lançou sua versão mais avançada de chatbot com ChatGPT-4. Bard recebeu sua maior atualização com Gemini Pro. Com a chegada do aplicativo Gemini aos telefones Android, o Google rebatizou oficialmente Bard como Gemini.


Considerando a concorrência acirrada, surge uma questão fundamental. O Google Gemini consegue acompanhar o OpenAI? Para descobrir, comparamos ChatGPT-4 e Gemini para ver seu desempenho em diferentes tarefas.


A evolução do ChatGPT

Após o sucesso do ChatGPT-3, a OpenAI lançou o GPT-3.5, um conversador mais bem treinado, capaz de abordar tópicos que vão desde ciência e tecnologia até arte e literatura. Mas foi o GPT-4 subsequente que revolucionou o jogo.


Disponível para assinantes por US$ 20 por mês, o GPT-4 possui um poder de processamento impressionante com uma janela de contexto de cerca de 25.000 palavras, um salto significativo em relação ao limite de 3.000 palavras do GPT-3.5. Esta atualização no GPT-4 permite uma compreensão mais precisa dos prompts contextuais e um melhor tratamento de conversas mais longas.

Google Gêmeos

Gemini é um modelo multimodal de linguagem grande (LLM) e a nova marca do chatbot do Google, anteriormente conhecido como Bard. Como LLM Gemini é o sucessor do LaMDA e PaLM2. Em dezembro de 2023, Bard recebeu sua maior atualização com Gemini Pro. Foi o primeiro sinal de que o Google se afastou da marca Bard com Gemini. O gigante das buscas o expandiu para mais de 170 países, adicionou suporte para outros idiomas, como japonês e coreano, e integrou-se estreitamente com outros aplicativos do Google, como Gmail, Docs e Drive.

Relacionado

O que são grandes modelos de linguagem?

Grandes modelos de linguagem (LLMs) são a base para chatbots de IA e muito mais. Aqui está o que está acontecendo nos bastidores

Com o lançamento do Gemini Ultra 1.0, o Google abandonou oficialmente a marca Bard em favor do Gemini e lançou-o na plataforma Android. Ele está disponível como um aplicativo independente. Para alguns usuários, o Gemini substituiu o Google Assistant.


Se você quiser experimentar o modelo de IA mais poderoso do Google, Ultra 1.0, atualize para o plano Gemini Advanced por US$ 20 mensais. Oferece melhor desempenho para tarefas altamente complexas, armazenamento de 2 TB no Google Drive e outros benefícios do Google One.

Resumo do enredo fictício

Uma área em que a IA poderia substituir os escritores humanos mais rapidamente do que o esperado são os simples resumos e o jornalismo baseado em notícias. Esse tipo de escrita geralmente encurta e simplifica textos mais longos existentes, algo em que a IA generativa se tornou boa. Histórias financeiras sobre o mercado de ações e que fazem malabarismos com uma tonelada de números são escritas pela IA.


Pedimos ao ChatGPT-3.5, ChatGPT-4 e Gemini que nos fornecessem resumos de 300 palavras do clássico de Frank Herbert Duna romance.



Nesta comparação entre Gemini e ChatGPT, ambos os modelos apresentam resultados promissores. Bard ficou atrás do GPT-4 em nossas comparações anteriores, desta vez. No entanto, Gemini está à altura do GPT-4 no fornecimento de um resumo completo e abrangente. Se você não está familiarizado com Dunaleia os resumos criados por Gemini e GPT-4.


GPT-3.5 oferece detalhes mais ricos, enquanto GPT-4 equilibra o esboço do enredo e o aprofundamento dos temas, dando aos leitores uma visão panorâmica da história. O resumo de Gêmeos pressupõe alguma familiaridade com Duna. Ele ignora detalhes importantes como o controle inicial do planeta Arrakis pelos Harkonnens e sua eventual recuperação com a ajuda do imperador.

Recomendações de compra

Muitas pessoas usam o Google para recomendações de compra, seja uma máquina de lavar nova ou um par de fones de ouvido para usar durante o treino. Como há uma enorme quantidade de informações on-line sobre os melhores e mais recentes produtos, os modelos generativos de IA devem ter facilidade em fornecer recomendações. Perguntamos ao ChatGPT e ao Bard qual novo telefone você deveria comprar.



Nesta comparação, as limitações de dados do GPT-3.5 de 2021 tornam-se evidentes, especialmente quando comparadas com o GPT-4 e o Google Gemini, ambos com recursos de navegação na web. O Google Gemini oferece uma lista detalhada dos principais telefones do mercado, incluindo especificações e preços. O GPT-3.5, devido às suas restrições, fornece conselhos de compra generalizados. ChatGPT-4 se alinha mais ao Google Bard, sugerindo modelos de telefone específicos. No entanto, ele não fornece detalhes de preços e especificações detalhadas.


ChatGPT e Google Gemini enfatizam a importância das preferências individuais, orçamentos e recursos desejados ao fazer recomendações. Neste confronto, o Google Gemini assume a liderança com sua lista abrangente dos principais modelos de telefones, bem como especificações e preços.

Fórmulas Excel

O Microsoft Excel e o Planilhas Google são ferramentas poderosas que auxiliam em muitas tarefas, incluindo rastreamento de preços de ações, gerenciamento de projetos usando gráficos de Gantt e análise de tendências de dados. Muitos de nós usamos apenas uma fração dos recursos disponíveis, principalmente quando se trata de fórmulas avançadas. É aí que as IAs de linguagem natural são úteis. Eles podem recomendar quais fórmulas usar para atingir seu objetivo com uma determinada planilha.



Neste confronto, ChatGPT-4 e Gemini assumem a liderança. GPT-4 e Gemini abordaram a questão com eficiência. Gemini ofereceu explicações detalhadas e fáceis de usar, mesmo para quem não está familiarizado com o Planilhas Google. O GPT-3.5, embora menos detalhado, forneceu informações essenciais complementadas por um exemplo.

Relacionado

Conheça Ernie: a alternativa da China ao Gemini

O Ernie 4.0 do Baidu é a resposta formidável da China à corrida da IA

Itinerários de viagens turísticas

Planejar uma viagem pode ser entediante e às vezes é difícil encontrar um bom lugar para começar. É aí que aplicativos informativos de planos de viagem e chatbots são úteis. Colocamos ChatGPT e Gemini um contra o outro em uma viagem de fim de semana de dois dias à cidade de Nova York.



Com base em nossa análise dos itinerários, Gemini ofereceu sugestões equilibradas com fontes relevantes da web e dicas na parte inferior. No entanto, o chatbot deturpou a ligação entre a Estátua da Liberdade, a Ilha da Liberdade e a Ilha Ellis, apelando a um regresso desnecessário ao Battery Park. O GPT-4 foi além da criação de roteiros e ofereceu dicas adicionais de viagem. Em contrapartida, o ChatGPT-3.5 aderiu estritamente à tarefa do itinerário.



As versões ChatGPT e Gemini apresentaram dias mais equilibrados, levando em consideração os intervalos para refeições e sugerindo bairros ideais para as refeições. Eles destacaram atrações populares e adotaram uma experiência de viagem holística, acrescentando sequências lógicas de atividades e experiências culturais únicas, como shows da Broadway.


Testamos a mesma tarefa usando Delhi, na Índia, como nossa próxima cidade. Gêmeos apresentou brevemente a capital da Índia e mostrou lugares relevantes para visitar em 48 horas. O chatbot do Google também exibe imagens relevantes com fontes da web para saber mais sobre os locais mencionados. Ele ainda sugeriu opções adicionais se você planeja estender sua viagem ou tiver mais tempo durante sua viagem à Índia. As dicas estão na parte inferior para tornar sua visita a Delhi memorável.



O GPT-4 também fez um trabalho louvável ao dividir toda a viagem entre o Sul de Delhi e a Velha Delhi. No entanto, deixou de sugerir Qutub Minar, uma das atrações mais populares da cidade. O GPT-3.5 também fez um trabalho sólido ao sugerir lugares relevantes para visitar em uma visita de dois dias a Delhi. Dividiu a viagem em manhã, meio-dia, tarde e noite e sugeriu mais lugares para visitar, que são difíceis de percorrer em alguns dias.

Bônus: como encontrar e ingressar em um programa de doutorado nos EUA

Para colocar Gemini e ChatGPT para trabalhar com uma questão mais complicada, pedimos a eles que nos orientassem no processo de inscrição em um programa de doutorado nos EUA, com a vantagem adicional de que não estudamos nos EUA, mas que obtivemos nosso mestrado na UE.



Gemini e ChatGPT-3.5 reconheceram que nos formamos na UE, mas nenhum deles analisou desafios potenciais, como certificados de idioma ou requisitos de visto para cidadãos não americanos. Em contrapartida, o GPT-4 explorou mais profundamente, abordando a logística de aplicação e aspectos pós-admissão, como o processo de visto e dicas para aclimatação cultural. Gêmeos primeiro discute a pesquisa e depois compartilha dicas para fortalecer seu perfil.


Ao examinar as respostas do ChatGPT, o GPT-3.5 destacou o papel dos orientadores no processo de doutorado, recomendando uma abordagem focada na pesquisa para as aplicações. O GPT-4 proporcionou uma visão abrangente do processo de admissão, apresentando um passo a passo lógico.


A franqueza de Bard contrasta com a orientação estruturada do GPT-4 e a abordagem centrada no consultor do GPT-3.5. Algumas das dicas mais úteis estão enterradas na parte inferior, que falam sobre como se conectar com atuais alunos ou ex-alunos de doutorado e explorar oportunidades de pesquisa e a vida nos EUA.

Uma palavra sobre aplicativos móveis

O Google lançou recentemente o Gemini no Android. A gigante das buscas planeja substituir o Google Assistant pelo Gemini no Android. Os usuários podem deslizar para cima a partir de qualquer canto inferior e usar o Gemini para suas consultas. Isso dá ao chatbot do Google uma vantagem sobre o ChatGPT da OpenAI. Esses modelos generativos de IA são treinados com base nos dados do usuário e, graças aos bilhões de usuários do Android em todo o mundo, o Google está mais bem preparado para coletar informações valiosas.


ChatGPT está acessível em Android e iPhone. Embora esses aplicativos móveis façam o trabalho, o Gemini parece moderno e mais intuitivo em comparação com um aplicativo ChatGPT sem graça.


A IA generativa tem muito potencial

Através de nossos testes, ChatGPT-4 e Gemini estão lado a lado. No entanto, ainda damos uma ligeira vantagem ao chatbot da OpenAI. ChatGPT-4 faz com que o investimento de US$ 20 por mês valha a pena. As respostas do GPT-3.5 e GPT-4 geralmente fornecem um contexto mais amplo e são excelentes para responder a dúvidas de acompanhamento. Eles também possuem funcionalidades aprimoradas, como a elaboração de fórmulas de planilhas. Nenhuma das soluções é 100% precisa. Por enquanto, verifique tudo o que essas ferramentas de IA generativa sugerem.


Quanto ao plano pago do Gemini de US$ 20 por mês, gostaríamos de ver a integração do Gemini no Gmail, Docs e outros aplicativos, que atualmente está faltando no plano Avançado.


Olhando para o futuro, não há dúvida de que o cenário mudará para melhor. ChatGPT e Gemini estão progredindo rapidamente e é previsível que se tornem ferramentas indispensáveis ​​em diferentes profissões, além de simplificar inúmeras tarefas cotidianas que em breve poderemos considerar certas.