LLaMA 2 é a segunda geração de uma inteligência artificial (IA) rápida e poderosa que Meta inicialmente projetou para pesquisa. A Meta lançou oficialmente o LLaMA 2 em 2023, um modelo de IA de código aberto em parceria com a Microsoft, para que os desenvolvedores pudessem usar a plataforma de computação em nuvem Azure. Também está disponível em outros fornecedores.
O LLaMA 2 permite o uso gratuito por pesquisadores de IA e desenvolvedores comerciais. Em comparação, outros modelos de linguagem grande e bem avaliados, como o ChatGPT da OpenAI e o modelo de IA Bard do Google, são sistemas proprietários. Isso torna o LLaMA 2 intrigante para desenvolvedores terceirizados que desejam acesso direto ao modelo.
O que é LLaMA 2?
LLaMA é um acrônimo para modelo de linguagem grande Meta AI. Presumivelmente, Meta omitiu um ‘M’ da sigla para tornar o nome mais memorável. A primeira versão foi lançada em fevereiro de 2023 em quatro tamanhos, contendo 7, 13, 33 e 65 bilhões de parâmetros.
O que são grandes modelos de linguagem?
Grandes modelos de linguagem (LLMs) são a base para chatbots de IA e muito mais. Aqui está o que está acontecendo nos bastidores
À medida que o número de parâmetros aumenta, um modelo de IA torna-se mais refinado, mas o grau de sofisticação varia entre os modelos de IA. Os meta-pesquisadores descobriram que o modelo de parâmetros 13B do LLaMA superou o GPT-3 da OpenAI, que possui parâmetros 175B. Nos testes do Meta, o LLaMA-65B teve um desempenho semelhante aos melhores modelos de IA da época, Chinchilla-70B e PaLM-540B.
A Meta apresentou o LLaMA 2 em julho de 2023, a segunda geração de seu modelo de IA. Ele tem um design semelhante, mas é treinado com um conjunto de dados 40% maior para criar uma IA mais avançada. Meta surpreendeu a indústria ao tornar o código-fonte aberto do LLaMA 2 com restrições mínimas de uso.
LLaMA 2 vem em três tamanhos de modelo, desde um modelo 7B pequeno, mas robusto, que pode ser executado em um laptop e um modelo 13B adequado para computadores desktop, até um modelo de 70 bilhões de parâmetros que requer um computador poderoso projetado para pesquisa e desenvolvimento de inteligência artificial.
O novo Snapdragon 8 Gen 3 da Qualcomm melhorou o processamento de IA com vários modelos de IA otimizados, para que os telefones Android mais recentes com esse chip possam executar a IA do Meta localmente. Você pode executar o LLaMA 2 na nuvem para uso casual, disponibilizando essa IA até mesmo em telefones Android baratos.
Quão bom é o LLaMA 2?
LLaMA 2 é muito bom e Meta diz que a versão com parâmetros 70B pode processar prompts de texto grandes e responder com melhor desempenho do que ChatGPT (GPT-3.5 Turbo). A Meta também lançou uma versão do LLaMA 2 otimizada para programação, Code LLaMA, que compete bem com o GPT-4 da OpenAI ao obter assistência para escrever código.
Embora OpenAI e Google tenham IA multimodal que pode aceitar imagens como entrada e criar novas imagens, o LLaMA 2 aceita apenas prompts de texto e gera respostas de texto. Para imagens, a Meta criou o Emu, que funciona com o LLaMA 2 para gerar adesivos no Instagram.
Os benchmarks de IA são úteis para avaliar velocidade e precisão, e o LLaMA 2 AI da Meta compete bem com os líderes do setor OpenAI e Google. A IA que dá os melhores resultados em testes criativos será sempre subjetiva.
Como posso usar o LLaMA 2?
O modelo LLaMA 2 está disponível no GitHub como código Python de código aberto e gratuito. Meta exige que você solicite acesso antes de baixar os pesos do modelo e o tokenizer do LLaMA 2. Estes são componentes críticos para executar a IA no seu computador. Você também precisa de um interpretador Python, já que é nessa linguagem que o LLaMA 2 está escrito.
Se algum desses requisitos parecer muito difícil, não se preocupe. Você não precisa instalar o LLaMA 2 no seu computador para usá-lo. Muitos modelos de IA são gratuitos no Hugging Face, incluindo o LLaMA 2.
Você também pode experimentar o LLaMA 2 no site de mesmo nome criado pelo Meta investidor e empresa de capital de risco Andreessen Horowitz. O uso é gratuito em qualquer um dos três tamanhos de modelo, com parâmetros 7B, 13B ou 70B. Ajustar o número de parâmetros lhe dará uma ideia de quanta diferença isso faz. O modelo de 7 bilhões de parâmetros é bastante bom e pode ser usado para muitas tarefas.
Se você quiser usar o LLaMA 2 para fins comerciais, o Microsoft Azure AI Studio pode executar o LLaMA 2 na nuvem. Alternativamente, o SageMaker da Amazon é executado na plataforma Amazon Web Services.
A grande vantagem dos modelos de IA de código aberto é o fácil acesso e as diversas opções.
Restrições do LLaMA 2
Embora o LLaMA 2 seja principalmente de código aberto e gratuito para uso comercial, o Meta tem restrições que podem afetar desenvolvedores e usuários comerciais.
Você deve solicitar uma licença da Meta se criar um aplicativo ou serviço que se torne popular entre mais de 700 milhões de usuários ativos mensais. Seu produto deve se tornar tão popular quanto o Snapchat antes que isso se torne uma preocupação.
Você não pode usar a saída do LLaMA 2 para melhorar qualquer outro modelo de linguagem grande. Essa técnica já foi usada antes. Alpaca é um chatbot de código aberto criado por pesquisadores da Universidade de Stanford usando resultados do ChatGPT. Isso foi feito estritamente para pesquisa, e o Alpaca nunca foi implantado.
Melhores aplicativos de IA para o seu telefone
Muitos aplicativos facilitam o uso de IA em seu telefone Android. Temos uma lista dos melhores aplicativos de IA para Android, com algumas dicas sobre como evitar o clickbait que acompanha qualquer conceito que crie entusiasmo.
Se você mora nos EUA, pode acessar facilmente o LLaMA 2, pois faz parte dos aplicativos WhatsApp e Messenger da Meta. LLaMA 2 está disponível globalmente através de um repositório de código GitHub e online em vários sites de hospedagem de IA.