如何準確的估計llm推理和微調的內存消耗

原創

deephub

2024-04-29 13:04

Command-R+， Mixtral-8x22b和Llama 3 70b都在最近的幾周內發佈了，這些模型是巨大的。它們都有超過700億個參數:

Command-R+: 104B參數

Mixtral-8x22b:具有141B參數的混合專家(MoE)模型

Llama 370b: 70.6B參數

你能在電腦上微調和運行這些模型嗎?

在本文中，我將介紹如何計算這些模型用於推理和微調的最小內存。這種方法適用於任何的llm，並且精確的計算內存總消耗。

https://avoid.overfit.cn/post/0046a7ef3a47406e9ed98d4ce947a14d

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【未完】關於ConditionalOnClass註解

1. pom文件標籤依賴配置文件我們經常接觸到，但對<optional>標籤理解可能一知半解（以我的角度，在這之前沒有關注過），或者是你沒看下面內容，都不知道optional應該放在什麼地方。 <optional>標籤在pom文件中長

帥氣的濤啊

2024-05-14 14:37:18

Mellanox網卡開啓SR-IOV

Mellanox網卡開啓SR-IOV SR-IOV是網卡虛擬化的一個重要功能。本文講介紹如何在Mellanox網卡上開啓SR-IOV，並創建一些VF。參考：Mellanox網卡開啓SR-IOV方法簡介-天翼雲開發者社區 - 天翼雲 (ct

CQzhangyu

2024-05-14 14:33:58

linux安裝cuda和cudnn

// 安裝cuda wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pinsudo mv cud

aozengling

2024-05-14 14:33:48

連接SQL Server報錯

將框架從.NET6升級到8，順便將各種依賴包也升級，容器化部署到測試環境後，SQL Server連接不了了： [2024-05-13 13:48:10 ERR] [Microsoft.EntityFrameworkCore.Databas

雪飛鴻

2024-05-14 14:29:37

uni-app實現上拉加載

參考文檔代碼： 1 <template> 2 <view> 3  4 <view v-for="item in dataList" :key="item.id">{{ item

賴忠標

2024-05-14 14:29:07

全面系統的AI學習路徑，幫助普通人也能玩轉AI

前言現如今AI技術和應用的發展可謂是如火如荼，它們在各個領域都展現出了巨大的潛力和影響力。AI的出現對於我們這些普通人而言也是影響匪淺，比如說使用AI工具GPT來寫文檔查問題、使用AI輔助編程工具幫助我們寫代碼、並且可是使用AI來實現人工

追逐時光

2024-05-14 14:27:17

vue3編譯優化之“靜態提升”

前言在上一篇 vue3早已具備拋棄虛擬DOM的能力了文章中講了對於動態節點，vue做的優化是將這些動態節點收集起來，然後當響應式變量修改後進行靶向更新。那麼vue對靜態節點有沒有做什麼優化呢？答案是：當然有，對於靜態節點會進行“靜態提升”

你假裝沒察覺

2024-05-14 14:26:37

計劃做點事情-跳槽

【最近想做什麼了】最近想跳槽了【爲什麼要做這個】現在的待遇有點低，或者說是太低了，想起來就覺得慘，難受，羞愧；目前看，在當前公司沒有發展前景，升級調薪機會不大，也太慢了；轉崗OD要再等一年多，而且，政策千變萬化，到時候大概率就不滿

eonie

2024-05-14 14:25:27

又是一個月-20240513

【今天又是什麼日子】今天是2024年5月13日，五一假期補班後第一週的第一天；是母親節，結婚一週年紀念日的第一天；是某個同事在職的最後一天；是又忙忙碌碌一個月一事無成後的普通的一天；【上次來是什麼時候】上次是2024年4月8日

eonie

2024-05-14 14:25:27

linux服務器設置ssh免密

http://www.mobiletrain.org/about/BBS/150708.html

張博的博客

2024-05-14 14:25:07

flask 如何保證返回json有序

return Response(json.dumps(ret), mimetype='application/json') return jsonify(med_data[int(req_data['from']):int

張博的博客

2024-05-14 14:25:07

cmakelist的一個例子

一個例子，僅做參考用： CMAKE_MINIMUM_REQUIRED(VERSION 3.12) set(ProjName "NetworkTest") project(${ProjName}) string(FIND ${CMAK

xcywt

2024-05-14 14:18:46

apisix~lua插件開發與插件註冊

開發插件的步驟在APISIX中，要自定義插件，一般需要按照以下步驟進行操作：編寫Lua腳本：首先，你需要編寫Lua腳本來實現你想要的功能。可以根據APISIX提供的插件開發文檔和示例進行編寫。將Lua腳本放置到APISIX插件

張佔嶺

2024-05-14 14:17:56

apisix~自定義插件的部署

參考 https://docs.api7.ai/apisix/how-to-guide/custom-plugins/create-plugin-in-lua https://apisix.apache.org/docs/apisix/n

張佔嶺

2024-05-14 14:17:56

HTML 00 Tutorial

HTML stands for HyperText Markup Language, it is a Standard Markup language for web pages. HTML is used to create cont

emanlee

2024-05-14 14:15:45

24小時熱門文章

如何準確的估計llm推理和微調的內存消耗

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

全面系統的AI學習路徑，幫助普通人也能玩轉AI

HTML 00 Tutorial

從零開始：使用 Playwright 腳本錄製實現自動化測試

uni-app實現上拉加載

vue3編譯優化之“靜態提升”

又是一個月-20240513

flask 如何保證返回json有序

Transformers 加速的一些常用技巧

You Only Cache Once:YOCO 基於Decoder-Decoder 的一個新的大語言模型架構

圖機器學習入門：基本概念介紹

使用PyTorch實現L1, L2和Elastic Net正則化

論文推薦：用多詞元預測法提高模型效率與速度

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結