Hugging Face-Transformers中的AutoModelForCausalLM 和 AutoTokenizer

原創

Eric zhou

2024-02-15 12:54

AutoModelForCausalLM 和 AutoTokenizer 是Hugging Face的Transformers庫中的兩個類，用於處理自然語言處理（NLP）任務。

AutoModelForCausalLM 是用於因果語言建模的模型的自動類，它可以加載不同的預訓練模型進行文本生成任務。

AutoTokenizer 用於加載與這些模型相對應的預訓練分詞器。

AutoTokenizer

AutoTokenizer 能夠根據預訓練模型自動選擇正確的分詞器。例如，如果你要加載一個GPT-2模型，AutoTokenizer 將會加載與GPT-2相對應的分詞器。

from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("gpt2")

AutoModelForCausalLM

AutoModelForCausalLM 是一個便捷的類，它根據你提供的模型名稱自動加載適合因果語言建模（如文本生成）的預訓練模型。

from transformers import AutoModelForCausalLM

model = AutoModelForCausalLM.from_pretrained("gpt2")

使用這些類進行文本生成

下面是如何使用這兩個類進行文本生成的簡單示例：

from transformers import AutoModelForCausalLM, AutoTokenizer

# 加載預訓練的分詞器和模型
tokenizer = AutoTokenizer.from_pretrained("gpt2")
model = AutoModelForCausalLM.from_pretrained("gpt2")

# 編碼輸入文本，增加返回的張量
input_text = "The meaning of life is"
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# 生成文本
output = model.generate(input_ids, max_length=50)

# 解碼生成的文本
decoded_output = tokenizer.decode(output[0])

print(decoded_output)

在這個例子中，我們首先加載了GPT-2的分詞器和模型。然後，我們將一些輸入文本編碼成模型可以理解的格式，並調用 generate 方法來生成文本。最後，我們將生成的張量解碼成人類可讀的文本。

確保在你的Python環境中安裝了transformers庫才能運行這些代碼。如果還沒有安裝，可以使用pip安裝：

pip install transformers

如果你在使用這些類時遇到了 ModuleNotFoundError，這通常意味着你的環境中沒有安裝 transformers 庫。

通過上面的命令可以安裝它。如果你在使用這些工具時遇到任何問題，Hugging Face提供了詳細的文檔和社區支持，可以幫助你解決問題。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Hugging Face-Transformers中的AutoModelForCausalLM 和 AutoTokenizer

AutoTokenizer

AutoModelForCausalLM

使用這些類進行文本生成

詐騙（殺豬盤）網站進行滲透測試

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

【Python】保存gym截圖

【譯】使用 GitHub Copilot 作爲你的編碼 GPS

Linux 服務器配置-安裝portainer-ce社區版

外行也能讀懂的網絡硬件設備功能原理速成

安裝Auto-GPT

SQLServer如何查詢近3分鐘最消耗CPU的SQL

SQLServer統計監控SQL執行計劃突變的方法

用戶體驗（UE）如何衡量設計的有效性

DDD領域驅動設計總結和C#代碼示例

Redis介紹、使用、數據結構和集羣模式總結

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結