Hugging Face Transformers

简介

Hugging Face Transformers 是目前最流行的开源 NLP 模型库，提供了超过 10 万个预训练模型，涵盖文本分类、问答、翻译、文本生成、图像识别等众多任务。它以简洁的 API 和丰富的模型生态，成为 AI 开发者必备的工具库。

开源项目：GitHub 仓库

主要功能

丰富模型库：10 万+ 预训练模型，包括 BERT、GPT、T5、LLaMA 等。
多模态支持：支持文本、图像、音频、视频等多种模态。
简单 API：几行代码即可使用预训练模型进行推理。
微调支持：提供 Trainer API 简化模型微调流程。
模型优化：支持量化、剪枝、蒸馏等模型优化技术。
Hub 集成：无缝访问 Hugging Face Hub 获取和分享模型。
跨框架：支持 PyTorch、TensorFlow、JAX 三大框架。

适用场景

Hugging Face Transformers 适用于多种场景：文本分类——情感分析、垃圾邮件检测等；问答系统——机器阅读理解、开放域问答；文本生成——内容创作、摘要生成、翻译；命名实体识别——信息抽取、实体识别；模型微调——针对特定任务微调预训练模型；研究实验——快速验证新想法和新方法。

安装与使用

安装 Transformers

# 安装核心库
pip install transformers

# 安装全部依赖
pip install "transformers[torch,tf]"

# 或安装指定框架
pip install torch transformers

快速使用

from transformers import pipeline

# 情感分析
classifier = pipeline("sentiment-analysis")
result = classifier("这是一个很好的产品！")
print(result)

# 问答系统
question_answerer = pipeline("question-answering")
result = question_answerer(
    question="法国的首都是什么？",
    context="法国首都巴黎是世界著名的城市。"
)
print(result)

使用预训练模型

from transformers import AutoModelForCausalLM, AutoTokenizer

# 加载模型和分词器
tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-2-7b-chat-hf")
model = AutoModelForCausalLM.from_pretrained("meta-llama/Llama-2-7b-chat-hf")

# 文本生成
inputs = tokenizer("你好，请介绍一下", return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=50)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

工具名称	公司/厂商	特色	适合人群
Transformers	Hugging Face	模型最丰富、生态完善、Hub 集成	所有 AI 开发者
LangChain	LangChain Inc.	应用开发框架、链式调用	构建 LLM 应用的开发者
spaCy	Explosion AI	专注 NLP、速度快、工业级	传统 NLP 任务
AllenNLP	AI2	研究友好、实验支持	NLP 研究人员

官网与入口

官网：https://huggingface.co/transformers

GitHub：https://github.com/huggingface/transformers

使用方式：通过 pip 安装，支持 PyTorch、TensorFlow、JAX 三大框架。可从 Hugging Face Hub 直接下载预训练模型。

价格与版本

开源版

完全开源免费
所有功能可用
社区支持

Pro 订阅

私有模型存储
加速下载
优先支持

Enterprise

企业协作平台
安全合规
专属支持

Transformers 库完全免费，部分 Hub 功能需要付费订阅

使用技巧

⚡

使用 pipeline 快速上手

pipeline 是最简单的方式，几行代码即可完成常见任务。

💾

利用模型缓存

首次下载的模型会缓存到本地 ~/.cache/huggingface/，后续使用更快。

🔧

模型量化减少内存

使用 bitsandbytes 量化模型，可大幅减少显存占用。

📦

使用 AutoClass 简化代码

AutoTokenizer、AutoModel 等自动类可根据模型名称自动加载。

常见问题

使用Transformers 和 diffusers 有什么区别？

Transformers 专注于 NLP 模型（文本），diffusers 专注于图像生成模型（图像）。两者都是 Hugging Face 的开源库。

模型如何选择合适的模型？

可在 Hugging Face Hub 上搜索任务名称，查看模型下载量和效果评测，选择适合的模型。

性能如何提升推理速度？

使用量化（int8、int4）、启用 torch.compile、批量推理、使用 GPU 加速等可提升速度。

小结

Hugging Face Transformers 作为 AI 开发者最常用的工具库，以其丰富的模型生态、简洁的 API 和完善的社区支持，成为 NLP 和大语言模型领域的标准工具。无论是快速原型验证还是生产环境部署，Transformers 都能提供强大的支持。

立即体验：访问 huggingface.co/transformers 查看官方文档开始使用。

简介