Hugging Face-Transformers中的AutoModelForCausalLM 和 AutoTokenizer

原創

Eric zhou

2024-02-15 12:54

AutoModelForCausalLM 和 AutoTokenizer 是Hugging Face的Transformers库中的两个类，用于处理自然语言处理（NLP）任务。

AutoModelForCausalLM 是用于因果语言建模的模型的自动类，它可以加载不同的预训练模型进行文本生成任务。

AutoTokenizer 用于加载与这些模型相对应的预训练分词器。

AutoTokenizer

AutoTokenizer 能够根据预训练模型自动选择正确的分词器。例如，如果你要加载一个GPT-2模型，AutoTokenizer 将会加载与GPT-2相对应的分词器。

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("gpt2")

AutoModelForCausalLM

AutoModelForCausalLM 是一个便捷的类，它根据你提供的模型名称自动加载适合因果语言建模（如文本生成）的预训练模型。

from transformers import AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("gpt2")

使用这些类进行文本生成

下面是如何使用这两个类进行文本生成的简单示例：

from transformers import AutoModelForCausalLM, AutoTokenizer

# 加载预训练的分词器和模型
tokenizer = AutoTokenizer.from_pretrained("gpt2")
model = AutoModelForCausalLM.from_pretrained("gpt2")

# 编码输入文本，增加返回的张量
input_text = "The meaning of life is"
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# 生成文本
output = model.generate(input_ids, max_length=50)

# 解码生成的文本
decoded_output = tokenizer.decode(output[0])

print(decoded_output)

在这个例子中，我们首先加载了GPT-2的分词器和模型。然后，我们将一些输入文本编码成模型可以理解的格式，并调用 generate 方法来生成文本。最后，我们将生成的张量解码成人类可读的文本。

确保在你的Python环境中安装了transformers库才能运行这些代码。如果还没有安装，可以使用pip安装：

pip install transformers

如果你在使用这些类时遇到了 ModuleNotFoundError，这通常意味着你的环境中没有安装 transformers 库。

通过上面的命令可以安装它。如果你在使用这些工具时遇到任何问题，Hugging Face提供了详细的文档和社区支持，可以帮助你解决问题。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Hugging Face-Transformers中的AutoModelForCausalLM 和 AutoTokenizer

AutoTokenizer

AutoModelForCausalLM

使用这些类进行文本生成

再谈23种设计模式（3）：行为型模式（学习笔记）

Power Automate Desktop 安装完，登录后老是提示one driver 错误

微前端学习笔记(4):从微前端到微模块之EMP与hel-micro方案探索

微前端学习笔记（1）：微前端总体架构概述，从微服务发微

985 硕士程序员，空窗 4 个月没有 Offer！

一文搞懂 Spring 循环依赖

赛博斗地主——使用大语言模型扮演Agent智能体玩牌类游戏。

VScode右键打开(添加到右键)

记一次 .NET某工控视觉自动化系统卡死分析

WindowsServer--SQL Server搭建主从同步实现读写分离 - 事务性分发

Redis數據存儲和讀寫

SQLServer如何監控阻塞會話

數據庫中存儲bool對象的數據，使用Bit和Integer有什麼區別，性能上有多大的差異

SQLServer如何查詢近3分鐘最消耗CPU的SQL

SQLServer統計監控SQL執行計劃突變的方法

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結