大語言模型加速推理LLM框架text-generation-inference踩坑實錄

原創

2023-06-29 12:05

安裝問題

1、儘量使用docker模式享用，能避免很多問題text-generation-inference
2、適配的機型在項目裏沒有說明，但是由於tgi高度依賴flash-attention，所以fa的依賴機型就是tgi的適配gpu機型，H100, A100, RTX 3090, T4, RTX 2080

使用問題

1、屏蔽的內容太多，不知道咋回事，docker-nvidia驅動安裝（適用Centos8）看這個鏈接text-generation-inference https://github.com/929359291/smaple/blob/main/README.md
2、其他使用問題可以留言，我經驗很豐富
3、falcon模型需要轉爲fp16格式，bf16格式框架沒法轉成safe...格式文件，無法加載運行
4、llama模型fp16、bf16兩種格式都可以順利加載運行

性能

實測使用tgi運行falcon-7b模型對比deepspeed框架有5倍的提升
實測使用tgi運行llama-7b模型對比deepspeed框架有2倍的提升

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

centos7下Docker 安裝

Docker 是一個開源的商業產品，有兩個版本：社區版（Community Edition，縮寫爲 CE）和企業版（Enterprise Edition，縮寫爲 EE）。企業版包含了一些收費服務，個人開發者一般用不到。下面的介紹都針對社區

2024-04-26 13:11:00

DataGear 5.0.0 新特性之dgMap圖表選項

DataGear 企業版 1.1.0 已發佈！ http://datagear.tech/pro/ DataGear在新發布的 5.0.0 版本中，重構了地圖類圖表，新增了dgMap圖表選項，可以更方便靈活地設置圖表地圖。在 5.0.0

2024-04-26 21:42:31

6個實例帶你解讀TinyVue 組件庫跨框架技術

本文分享自華爲雲社區《6個實例帶你解讀TinyVue 組件庫跨框架技術》，作者：華爲雲社區精選。在DTSE Tech Talk 《手把手教你實現mini版TinyVue組件庫》的主題直播中，華爲雲前端開發DTSE技術佈道師阿健老師給

2024-04-26 10:33:20

MySQL 核心模塊揭祕 | 15 期 | 事務模塊小結

✍ 專欄小結 1 月 3 日，我在社區發佈事務模塊的第一篇文章；4 月 17 日，發佈了最後一篇文章。歷時 3 個半月，用 14 篇文章對事務模塊做了比較全面的介紹。本文我們對事務模塊已經發布的 14 篇文章做個簡單回顧。 01 期《事

2024-04-24 23:20:56

一則 TCP 緩存超負荷導致的 MySQL 連接中斷的案例分析

除了 MySQL 本身之外，如何分析定位其他因素的可能性？作者：龔唐傑，愛可生 DBA 團隊成員，主要負責 MySQL 技術支持，擅長 MySQL、PG、國產數據庫。愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註

2024-04-24 23:20:53

自學編程兩個月，現在我月入 4 萬元

這個外國小哥叫 Nico，他一開始是個編程小白，後來把自己關在房間裏花了兩個月時間學會了編程，如今正在開發一款名爲 Talknotes 的應用，可以將語音備忘錄轉化爲結構化的內容，月收入 5000 美元。 Nico 從高中畢業就開始創業，

2024-04-24 21:14:29

2024 開源數據工程生態系統全景圖

點擊藍字關注我們作者 | ALIREZA SADEGHI翻譯 | Debra Chen 01 簡介

2024-04-23 21:30:36

RAG 修煉手冊｜如何評估 RAG 應用？

如果你是一名用戶，擁有兩個不同的 RAG 應用，如何評判哪個更好？對於開發者而言，如何定量迭代提升你的 RAG 應用的性能？顯然，無論對於用戶還是開發者而言，準確評估 RAG 應用的性能都十分重要。然而，簡單的幾個例子對比並不能全面衡量

2024-04-23 21:20:22

MyDumper “喜歡” 觸發器麼？

是的，但現在它更“喜歡”它們，原因如下。介紹使用 LIKE 子句過濾特定表中的觸發器或視圖很常見。但是，它可能會欺騙您，特別是如果您看不到輸出（即在非交互式會話中）。讓我們看一個簡單的例子，以及如何以更可靠的方式處理任務。還有一個指向

2024-04-22 23:19:50

一次奇妙的任意用戶登錄實戰

剛剛進行了微信sessionkey的學習，正準備實戰一下，就發現了這個神奇的網站，預知後事如何。請繼續向下看去 1. 目標 2. 開局一個登錄框 3. 首先，直接弱口令走起來，萬一留有測試的賬號呢嘗試，1311111111，1333

2024-04-22 22:46:11

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

入職3年-我如何做一名AI產品經理

引言從2021年校招加入京東開始，我一直從事AI產品經理的工作，有幸見證了AI行業的熱情從一臺臺服務器燒到了全世界各個角落，也見證了京東AI中臺團隊的影響力如何一步步的擴大。從21年的迷茫到24年的堅定，很慶幸我正走在適合自己的道路上，

2024-04-22 11:16:31

k3d創建集羣並暴露traefik端口

1. 安裝docker curl -fsSL https://get.docker.com | bash -s docker --mirror Aliyun 2. 安裝k3d wget -q -O - https://raw.githu

2024-04-24 21:13:26

解決k3d或者k3s搭建k8s集羣在發佈鏡像過程中提示ImagePullBackOff問題

筆者嘗試在k3d搭建的k8s集羣中發佈tomcat服務，結果遲遲無法啓動，以下爲創建容器到解決的過程： 1. 發佈tomcat指令 kubectl create deployment tomcat --image=tomcat --port

2024-04-26 21:13:35

實踐展示openEuler部署Kubernetes 1.29.4版本集羣

本文分享自華爲雲社區《openEuler部署Kubernetes 1.29.4版本集羣》，作者：江晚正愁餘。一、Kubernetes集羣節點準備 1.1 主機操作系統說明序號操作系統及版本備註 1 CentOS7u9或 Open

2024-04-22 10:33:11

24小時熱門文章

Golang爬蟲代理接入的技術與實踐

最新文章

最新評論文章