一. 整體說明
1. 限制說明
(1).在官網上Web頁面聊天
gpt-4: 3個小時內只能問25個問題 !!!
gpt3.5: 沒有限制
(2). 調用api
gpt3.5: 免費的賬號裏面有5$ 額度的token數量值,並且有到期時間限制;充值比較麻煩(需要用國外的銀行卡),只能重新申請賬號了, 詳見圖01
gpt4: 40k TPM and 200 RPM.
2. 速率限制(Rate limits)
兩個指標: TPM (tokens per minute) RPM (requests per minute)
以免費版本的gpt3.5爲例,不同模型限制如下:https://platform.openai.com/account/rate-limits
詳見圖:
3. 創建Api key用於開發
創建api key用於開發,詳見圖 (特別注意:只有創建的時候可以copy一次,後續將不支持copy,只能重新創建了)
4. 一些概念
(1). tokens:按照一定的規則進行拆分,比如hamburger,被認爲是3個token,分別是:ham、bur、ger;另外一個漢字是2個token。
Most models have a context length of 2048 tokens[提問+結果] (except for the newest models, which support 4096(大約3000個words)).
ps:通過這個網址來測試內容有多少個token,https://platform.openai.com/tokenizer
(2). models:Api的調用是基於不同模型的不同能力 和 價格來進行的。比如:gpt-4是最新的模型, GPT-3.5-Turbo是支持chatgpt的,並且針對對話進行了優化
更多的模型概念詳見 下面章節
(3). prompt: 提示、提示性語言 (一般用作chatgpt提問的內容)
(4). a text completion: 文本補全 (一般用作chatgpt返回的結果)
(5). temperature: 精確值、精確度。一般介於0-1之間,當爲0,答案更加準確風險更小,大於0的時候,答案將更加多樣化
(6). Fine-tuning: 微調,指的是調整模型
(7). retrieve : 檢索、找回
5. 價格
對於新賬號而言,3個月內贈送5美元的額度。
以後的價格,以 gpt-3.5-turbo爲例,$0.002 / 1K tokens, (即1000個token,0.002美元)
更多價格詳見:https://openai.com/pricing#language-models
6. 類庫
支持多種語言,詳見:https://platform.openai.com/docs/libraries/community-libraries
以.Net爲例,主要有三個包
OpenAI https://github.com/OkGoDoIt/OpenAI-API-dotnet
Betalgo.OpenAI https://github.com/betalgo/openai
OpenAI-DotNet https://github.com/RageAgainstThePixel/OpenAI-DotNet
其中Betalgo.OpenAI的stars最多1.9k,OpenAI下載次數最多9w,這裏先以OpenAI這個爲主,研究樣例
7. 模型-models
(1) 什麼是模型?
OpenAi下的所有api都是基於不同模型進行,不同的模型具備不同的能力 和 價格。
(詳見:https://platform.openai.com/docs/models/overview)
(2).常見的模型有哪些?
GPT-4 :截至目前位置最強大的ai模型,使用是有限制的,當前
GPT-3.5 :免費的最新的模型,訓練數據時間截至21年9月,可以滿足絕大多數場景
DALL·E (Beta):用於生成和編輯圖像的模型
Whisper (Beta):用於將音頻轉換成文本的模型
Embeddings:將文本轉換成數字的模型
Moderation:監測文本是否敏感和安全的模型(比如是否包含:暴力、黃色、仇恨、自我傷害等)
GPT-3: 現在已經被GPT-3.5取代了
Codex (Deprecated):已經廢棄了
(3).不同模型下的細分類,以gpt-3.5爲例,具體包含:
gpt-3.5-turbo、gpt-3.5-turbo-0301、text-davinci-003、text-davinci-002、code-davinci-002 其中:
gpt-3.5-turbo是一個正式版本, 也是我們推薦使用的版本
gpt-3.5-turbo-0301:是一個快照版本,快照於2023年3月,當新版本出來以後,該版本將在三個月後廢棄
注: 推薦使用 text-davinci-003 和 GPT-3.5-Turbo,具有更低的延遲和更好的結果。 更強大的可以使用 gpt4模型
(4).請求地址兼容性
8. ChatGPT的用途
(1). 各種問題的提問,類似百度、google
(2). 生成各種代碼,調試代碼錯誤
(3). 翻譯各國語言
(4). 生成文案,比如廣告語、論文、合同 等等
(5). 訓練格式,生成想要的格式答案
(6). 聊天機器人, 比如:情感機器人
(7). 文字轉換成 emoj 圖片
(8). 生成excel表格形式的文案,直接拷貝到excel中,再調整下格式
(9). 製作思維導圖:利用gpt生成markdown格式,然後用xmind導入md文件生成即可。
9. 侷限性
(1). gpt3.5訓練到202109,實時問題回答不了,比如:今天天氣如何。
二. 功能介紹
1.Text completion (如何生成和操作文本)
(1). 翻譯各國語言
(2). 文字轉換成 emoj 圖片
(3). 聊天機器人
(4). 判斷文案是積極、消極、或是 中立的
(5). 寫總結,對一篇文章進行簡要總結
(6). 代碼補全, 比如:一個react組件的代碼補全
(7). 文本補全
(8). 編輯文本
2.Chat Completions (完成聊天)
(使用chat api,基於gpt-3.5-turbo 或 gpt-4 模型進行如下操作)
(1).作用
起草一封電子郵件或其他寫作
編寫Python代碼
回答一組問題
創建會話代理
給你的軟件一個自然語言接口
輔導各種科目
翻譯語言
模擬人物的視頻遊戲和更多
(2).對比
由於gpt-3.5-turbo的性能與text-davinci-003相似,但每個token的價格是其10%,因此我們建議在大多數用例中使用gpt-3.5-turbo。
3. Image generation (如何生成和操作圖片)
(使用 DALL·E 模型)
(1). 作用
A.基於輸入內容從零開始創建圖像
B.基於新的文本內容創建對現有圖像的編輯
C.創建已有圖像的變體
注:每個圖像將以url或base64的形式返回,url將在一小時後過期
4.Fine-tuning (如何爲應用程序定製模型,自己準備數據訓練模型)
(1). fine-tuning(微調)有什麼好處?
比提示更高質量的結果、能訓練出更多的例子、節省tokens數量、更低延遲的請求
(2). 哪些模型可以微調?
davinci, curie, babbage, and ada (這些都是gpt3的模型)
5.Embeddings(測量字符串文本的相關性)
(1).作用
搜索(根據與查詢字符串的相關性對結果進行排序)
聚類(其中文本字符串按相似性分組)
推薦(推薦帶有相關文本字符串的項)
異常檢測(識別相關性很小的異常值)
多樣性測量(分析相似性分佈)
分類(按最相似的標籤對文本字符串進行分類)
6.Speech to text(如何將音頻轉換成文本)
(1). 作用
A.將音頻轉錄成任何語言的音頻
B.將音頻翻譯成英文
7.Moderation
(1). 作用
判斷輸入內容是否隸屬於以下類別:
hate、hate/threatening、self-harm、sexual、sexual/minors、violence、violence/graphic
8.Rate limits(單位時間內訪問服務器次數的限制)
(1). 兩個指標
TPM (tokens per minute) RPM (requests per minute)
比如gpt4的限制:40k TPM and 200 RPM.
!
- 作 者 : Yaopengfei(姚鵬飛)
- 博客地址 : http://www.cnblogs.com/yaopengfei/
- 聲 明1 : 如有錯誤,歡迎討論,請勿謾罵^_^。
- 聲 明2 : 原創博客請在轉載時保留原文鏈接或在文章開頭加上本人博客地址,否則保留追究法律責任的權利。