Hugging Face é uma plataforma para visualizar, compartilhar e apresentar modelos de aprendizado de máquina, conjuntos de dados e trabalhos relacionados. O objetivo é tornar os Modelos de Linguagem Neural (NLMs) acessíveis a qualquer pessoa que crie aplicativos com tecnologia de aprendizado de máquina. Muitos modelos populares de IA e aprendizado de máquina são acessíveis por meio do Hugging Face, incluindo o LLaMA 2, um modelo de linguagem de código aberto que a Meta desenvolveu em parceria com a Microsoft.
Hugging Face é um recurso valioso para iniciantes começarem a usar modelos de aprendizado de máquina. Você não precisa pagar por nenhum aplicativo ou programa especial para começar. Você só precisa de um navegador da Web para navegar e testar modelos e conjuntos de dados em qualquer dispositivo, mesmo em Chromebooks econômicos.
O que é abraçar o rosto?
Hugging Face fornece ferramentas de aprendizado de máquina para a construção de aplicativos. Ferramentas notáveis incluem a biblioteca de modelos Transformers, pipelines para realizar tarefas de aprendizado de máquina e recursos colaborativos. Ele também oferece conjuntos de dados, avaliação de modelos, simulação e bibliotecas de aprendizado de máquina. Hugging Face pode ser resumido como a prestação destes serviços:
- Hospedagem de modelos de aprendizado de máquina pré-treinados de código aberto.
- Fácil acesso a esses modelos através de vários ambientes (por exemplo, Google Colab ou ambiente virtual Python).
- Ferramentas para ajustar modelos de aprendizado de máquina.
- Uma API que oferece uma interface amigável para realizar diversas tarefas de aprendizado de máquina.
- Espaços comunitários para colaboração, compartilhamento e apresentação de trabalhos.
Hugging Face recebe financiamento de empresas como Google, Amazon, Nvidia, Intel e IBM. Algumas dessas empresas criaram modelos de código aberto acessíveis através do Hugging Face, como o modelo LLaMA 2 mencionado no início deste artigo.
O que é IA Constitucional?
E é a resposta para implantar IA com segurança?
O número de modelos disponíveis no Hugging Face pode ser impressionante, mas é fácil começar. Orientamos você em tudo o que você precisa saber sobre o que pode fazer com o Hugging Face e como criar suas próprias ferramentas e aplicativos.
O que você pode fazer com Abraçar o Rosto?
O núcleo do Hugging Face é a biblioteca de modelos do Transformers, a biblioteca de conjuntos de dados e os pipelines. Compreender esses serviços e tecnologias fornece tudo o que você precisa para usar os recursos do Hugging Face.
A biblioteca de modelos dos Transformers
A biblioteca de modelos Transformers é uma biblioteca de modelos de transformadores de código aberto. Hugging Face possui uma biblioteca de mais de 495.000 modelos agrupados em tipos de dados chamados modalidades. Você pode usar esses modelos para executar tarefas com pipelines, que explicaremos posteriormente neste artigo.
Algumas das tarefas que você pode executar por meio da biblioteca de modelos do Transformers são:
- Detecção de objetos
- Resposta a perguntas
- Resumo
- Geração de texto
- Tradução
- Conversão de texto para fala
Uma lista completa dessas tarefas pode ser vista no site Hugging Face, categorizadas para facilitar a busca.
Dentro dessas categorias existem vários modelos criados por usuários para você escolher. Por exemplo, Hugging Face hospeda atualmente mais de 51.000 modelos para geração de texto.
Se você não tiver certeza de como iniciar uma tarefa, Hugging Face fornece documentação detalhada sobre cada tarefa. Esses documentos incluem casos de uso, explicações de variantes de modelos e tarefas, ferramentas relevantes, cursos e demonstrações. Por exemplo, a demonstração na página de tarefas Geração de Texto usa os modelos de linguagem Zephyr para completar modelos. Você consultará o modelo para obter instruções sobre como usá-lo para a tarefa.
Essas ferramentas facilitam a experimentação de modelos. Embora alguns sejam pré-treinados com dados, outros precisarão de conjuntos de dados, e é aí que a biblioteca de conjuntos de dados entra em ação.
Usando a biblioteca de conjuntos de dados
A biblioteca de conjuntos de dados Hugging Face é adequada para todas as tarefas de aprendizado de máquina oferecidas na biblioteca de modelos Hugging Face. Cada conjunto de dados contém um visualizador de conjunto de dados, um resumo do que está incluído no conjunto de dados, o tamanho dos dados, tarefas sugeridas, estrutura de dados, campos de dados e outras informações relevantes.
O que são grandes modelos de linguagem?
Grandes modelos de linguagem (LLMs) são a base para chatbots de IA e muito mais. Aqui está o que está acontecendo nos bastidores
Por exemplo, o conjunto de dados da Wikipédia contém artigos limpos da Wikipédia em todos os idiomas. Possui toda a documentação necessária para compreender e usar o conjunto de dados, incluindo ferramentas úteis como um mapa de visualização de dados de amostra. Dependendo do conjunto de dados que você acessa, você poderá ver exemplos diferentes.
Usando pipelines para executar tarefas
Modelos e conjuntos de dados são o poder por trás da execução de tarefas do Hugging Face, mas os pipelines facilitam o uso desses modelos para concluir tarefas.
Os pipelines do Hugging Face simplificam o uso de modelos por meio de uma API que elimina o uso de código abstrato. Você pode fornecer um pipeline com vários modelos especificando qual deles deseja usar para ações específicas. Por exemplo, você pode usar um modelo para gerar resultados a partir de uma entrada e outro para analisá-los. É aqui que você precisará consultar a página do modelo usada para os resultados para interpretar os resultados formatados corretamente.
Hugging Face apresenta um detalhamento completo das tarefas para as quais você pode usar pipelines.
Como começar com o abraço facial
Agora que você entende os modelos, conjuntos de dados e pipelines fornecidos pelo Hugging Face, está pronto para usar esses ativos para executar tarefas.
Você só precisa de um navegador para começar. Recomendamos o uso do Google Colab, que permite escrever e executar código Python em seu navegador. Ele fornece acesso gratuito a recursos de computação, incluindo GPUs e TPUs, tornando-o ideal para tarefas básicas de aprendizado de máquina. O Google Colab é fácil de usar e não requer configuração.
Depois de se familiarizar com o Colab, você estará pronto para instalar as bibliotecas do transformador usando o seguinte comando:
!pip install transformers
Em seguida, verifique se foi instalado corretamente usando este comando:
import transformers
Agora você está pronto para mergulhar nas bibliotecas do Hugging Face. Há muitos lugares para começar, mas recomendamos o curso introdutório do Hugging Face, que explica detalhadamente os conceitos que descrevemos anteriormente com exemplos e questionários para testar seu conhecimento.
Colaborando com Hugging Face
A colaboração é uma grande parte do Hugging Face, permitindo discutir modelos e conjuntos de dados com outros usuários. Hugging Face incentiva a colaboração por meio de um fórum de discussão, um blog da comunidade, Discord e salas de aula.
Modelos e conjuntos de dados no Hugging Face também têm seus próprios fóruns onde você pode discutir erros, fazer perguntas ou sugerir casos de uso.
O aprendizado de máquina e a IA são assustadores para iniciantes, mas plataformas como o Hugging Face oferecem uma ótima maneira de apresentar esses conceitos. Muitos dos modelos populares no Hugging Face são modelos de linguagem grande (LLMs), portanto, familiarize-se com os LLMs se planeja usar ferramentas de aprendizado de máquina para geração ou análise de texto.