如何准确的估计llm推理和微调的内存消耗

原創

deephub

2024-04-29 13:04

Command-R+， Mixtral-8x22b和Llama 3 70b都在最近的几周内发布了，这些模型是巨大的。它们都有超过700亿个参数:

Command-R+: 104B参数

Mixtral-8x22b:具有141B参数的混合专家(MoE)模型

Llama 370b: 70.6B参数

你能在电脑上微调和运行这些模型吗?

在本文中，我将介绍如何计算这些模型用于推理和微调的最小内存。这种方法适用于任何的llm，并且精确的计算内存总消耗。

https://avoid.overfit.cn/post/0046a7ef3a47406e9ed98d4ce947a14d

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

SQL server2019安装图文教程（详细）

SQL server2019安裝（詳細）_sql2019安裝哪些功能-CSDN博客

imadi

2024-05-29 12:52:37

使用Naudio使用指定声卡播放声音

// 獲取WaveOut設備數量 int deviceCount = WaveOut.DeviceCount;

imadi

2024-05-29 12:52:37

AI智能体服务平台-智能客服系统-独立部署搭建

平臺簡介 LLM大模型是AI大腦，智能體就是AI的手和腳。我們一直在積極探索將大模型技術運用到有價值的業務場景上，而不是僅僅停留在娛樂性的聊天，探索出了以下組合使用方式：即時通訊人工客服系統+LLM大模型+RAG搜索增強知識庫+

陶士涵

2024-05-29 12:51:57

阿里云语音合成TTS直播助手软件开发

阿里雲的TTS比較便宜，效果比不了開源克隆的那種，比純機器人效果好一點點阿里雲sambert https://help.aliyun.com/zh/dashscope/developer-reference/quick-start-13

陶士涵

2024-05-29 12:51:57

html face属性

無意間發現郵件裏面的字體非常像手寫的,然後點擊HTML源碼發現,使用了這個face屬性. 代碼如下: <font face="comic sans ms">PS：你看看我這裏的數字是不是跟普通數字不一樣 123456789</font>

李照耀

2024-05-29 12:51:27

京东二面：为什么Netty要造FastThreadLocal？

FastThreadLocal 從字面意義上來看，它是“Fast”+“ThreadLocal”的結合體，寓意爲快速的 ThreadLocal。那麼，問題來了，Netty 爲什麼要再造一個 FastThreadLocal？FastThread

Java中文社羣

2024-05-28 14:33:04

微信小程序预约视频号直播

一、概述微信小程序提供了可以喚起預約視頻號直播彈窗的接口 reserveChannelsLive，該接口接收一個參數 noticeId，通過 getChannelsLiveNoticeInfo 接口獲取。因此，過程如下：查看視頻號 i

麥豇豆

2024-05-28 14:22:23

公众号5月C#/.NET热文一览

C#/.NET/.NET Core全面的學習、工作、面試指南知識庫轉眼之間維護DotNetGuide（C#/.NET/.NET Core學習、工作、面試指南知識庫）已經持續超過了三年多的時間，Commit提交數也超過900+，在前幾天Gi

追逐時光

2024-05-28 14:22:13

Spring Boot 3.3 正式发布，王炸级更新，应用启动速度直接起飞！

Java技術棧

2024-05-28 14:21:32

公司刚入职了一名 Java 中级开发，短短 4 行代码居然凑齐了 3 个 bug！我哭了~~

作者：l拉不拉米鏈接：https://juejin.cn/post/7031445206152577061 一、前言公司剛入職了一名中級Java開發，經過一個星期的適應學習，各方面表現還不錯，於是分配了一個小的迭代給新人做。需求很簡

Java技術棧

2024-05-28 14:21:32

彻底搞清楚vue3的defineExpose宏函数是如何暴露方法给父组件使用

前言衆所周知，當子組件使用setup後，父組件就不能像vue2那樣直接就可以訪問子組件內的屬性和方法。這個時候就需要在子組件內使用defineExpose宏函數來指定想要暴露出去的屬性和方法。這篇文章來講講defineExpose宏函數是

你假裝沒察覺

2024-05-28 14:21:21

🔥 FolkMQ v1.5.1 发布（“新式” 国产消息中间件）

FolkMQ 是個“新式”的消息中間件。強調：“小而巧”、“簡而強”。功能簡表角色功能生產者（客戶端）發佈普通消息、Qos0消息、定時消息、順序消息、可過期消息、事務消息、廣播消息消費者（客戶端）訂閱

劉之西東

2024-05-28 14:21:21

cv2读取图片中文路径问题

https://blog.csdn.net/liuqinshouss/article/details/78696032

張博的博客

2024-05-28 14:20:01

盟军敢死队2官网

http://www.mj141319.imotor.com/index.php 裏面有盟軍敢死隊2 五百多關的下載. 需要一個一個安裝.

張博的博客

2024-05-28 14:20:01

git 下载大陆镜像地址

https://github.com/waylau/git-for-win?tab=readme-ov-file

張博的博客

2024-05-28 14:20:01

24小時熱門文章

如何准确的估计llm推理和微调的内存消耗

公司刚入职了一名 Java 中级开发，短短 4 行代码居然凑齐了 3 个 bug！我哭了~~

公众号5月C#/.NET热文一览

git 下载大陆镜像地址

SUPRA：無須額外訓練，將Transformer變爲高效RNN，推理速度倍增

2024年5月大語言模型論文推薦：模型優化、縮放到推理、基準測試和增強性能

2024年5月計算機視覺論文推薦:包括擴散模型、視覺語言模型、圖像編輯和生成、視頻處理和生成以及圖像識別等各個主題

使用FP8加速PyTorch訓練的兩種方法總結

MambaOut：狀態空間模型並不適合圖像的分類任務

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結