BurstAttention:可對非常長的序列進行高效的分佈式注意力計算

原創

2024-03-24 13:04

提高llm中注意力機制效率的努力主要集中在兩種方法上:優化單設備計算和存儲能力，如FlashAttention，以及利用多設備的分佈式系統，如RingAttention。

FlashAttention通過使用靜態隨機存儲器(SRAM)來存儲中間狀態，而不是依賴於高帶寬存儲器(HBM)來提高注意力計算速度。

而RingAttention通過將長序列劃分爲子序列並將其分佈在多個設備上進行並行處理來處理長序列。

雖然它們都提高了處理速度和效率，如果將它們組合起來使用是否可以有更大的提高呢？理論上是這樣，但是在分佈式環境中直接組合這兩種方法無法充分利用它們的優勢，並且存在兼容性問題。

而最新的研究BurstAttention可以將2者結合，作爲RingAttention和FlashAttention之間的橋樑。

BurstAttention是一個創新的框架，它優化了跨設備的計算和通信，增強了內存使用，最小化了通信開銷，提高了緩存效率。

https://avoid.overfit.cn/post/5aacdef85b104ff0a9faea9ad84f2a95

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

What does "xargs grep" do?

https://askubuntu.com/questions/833128/what-does-xargs-grep-do https://superuser.com/questions/46199/how-to-combine-fi

2024-04-27 13:38:13

[轉帖]mysqldump --master-data=2 --single-transaction

https://www.cnblogs.com/cheyunhua/p/9896167.html 轉載於https://blog.csdn.net/linuxheik/article/details/714808821 mysq

濟南小老虎

2024-04-27 13:32:52

一部分Neo4j的記錄

Neo4j 爲什麼需要圖數據庫隨着技術的發展,我們對數據的需求已經不再侷限於對數據本身的獲取了,我們還需要獲取數據與數據間的關係(也就是連接數據). 簡單地說,我們可以說圖數據庫主要用於存儲更多的連接數據(因爲圖結構相比其他數據結構而言,

2024-04-27 13:31:52

如何有效報告Bug

良好的態度：禮貌提問，保持謙卑，保持好奇；得到回答請說“謝”。準確描述問題：報錯信息（文本和截圖）要完整。不完整的報錯信息無法獲得有效回答預期結果要講清楚，不符合預期的現象要標明常見的錯誤原因：看不懂報錯：

2024-04-27 13:30:02

Rabbitmq系列02---Exchange

個人理解：交換機的類型劃分個人理解是能過routing key來劃分的，一是否按routing key找隊列；fanout就是不按routingkey找隊列，Direct和Topicr按routingkey找隊列，只是一個模糊找，一個精準

2024-04-27 13:28:22

rabbitmq系列03---發佈確認

一、發佈確認邏輯生產者將信道設置成 confirm 模式，一旦信道進入 confirm 模式，所有在該信道上面發佈的消息都將會被指派一個唯一的 ID (從 1 開始)，一旦消息被投遞到所有匹配的隊列之後，broker 就會發送一個確認給生

2024-04-27 13:28:22

二十二、性能優化

一、數據庫性能瓶頸-IO瓶頸第一種：磁盤讀IO瓶頸，熱點數據太多，數據庫緩存放不下，每次查詢會產生大量的IO，降低查詢速度第二種：網絡IO瓶頸，請求的數據太多，網絡帶寬不夠二、數據庫性能瓶頸-CPU瓶頸第一種：SQl問題：如SQL中

2024-04-27 13:22:11

二十三、數據庫性能優化方案

數據庫的優化方案核心本質有三種：減少數據量、用空間換性能、選擇合適的存儲系統，這也對應了開篇講解的慢的三個原因：數據總量、高負載、查找的時間複雜度。一、減少數據量數據序列化存儲、數據歸檔、中間表生成、分庫分表。二、用空間換性能　

2024-04-27 13:22:11

程序員從0到1創業時，第一步重要的思考是什麼？

前言其實想到這個標題，是看了一本書 -《重新理解創業》，易道前創始人周航寫的一本關於創業反思的書，我覺得這本書第一章節就很有意思。他這本書第一章標題：重新理解戰略。一想到公司戰略，就覺得很高大上，而且對於基層員工來說是遙不可及的事情。於

2024-04-27 13:21:11

.net mysql連接字符串中指定數據庫字符串和排序規則

連接字符串 server=localhost;port=3306;database=xcgdb;uid=root;pwd=root;charset=utf8mb4;collation=utf8mb4_general_ci;

2024-04-27 13:10:30

ETL工具-nifi乾貨系列第十八講 nifi Funnel實戰教程

1、Funnel （漏斗），Funnel是 NiFi 組件，用於將多個連接中的數據合併到一個連接中。使用場景：nifi中的Funnel組件用於合併多個數據流並將它們傳遞到下游處理器。它可以將來自不同來源的數據流合併到一個數據流中，方便後續

2024-04-27 13:07:40

好久沒關注uCOS系統的消息了，全家桶免費後，竟一直以全新的名字Flexible Safety RTOS登場，且一直在更新

【視頻版】 https://www.bilibili.com/video/BV1Kb421Y7v9 【前言】 2020年初，uCOS全家桶宣佈免費後，其Github上uCOS-III更新過兩個小版本，uCOS-II僅更新了一次，後面就一直

2024-04-27 13:04:09

【每日一題】愛生氣的書店老闆

1052. 愛生氣的書店老闆有一個書店老闆，他的書店開了 n 分鐘。每分鐘都有一些顧客進入這家商店。給定一個長度爲 n 的整數數組 customers ，其中 customers[i] 是在第 i 分鐘開始時進入商店的顧客數量，所有這些顧

2024-04-27 12:59:59

有沒有大佬知道這種數據應該怎麼抓取呀？

大家好，我是Python進階者。一、前言前幾天在Python白銀交流羣【王者級混子】問了一個Python網絡爬蟲的問題。問題如下：有沒有大佬知道這種數據應該怎麼抓取呀？我鼠標移到上面纔會出現的數據。二、實現過程這裏【Crazy】和

2024-04-27 12:55:29

docker之旅 6.docker下面安裝mysql, 訪問mysql

一不小心又踩坑了。 # 拉取 mysql 鏡像 docker pull mysql 修改 docker-compose.yml ，創建一個 mysql 的容器，跟隨系統啓動這是我的 docker-compose.yml 文

2024-04-27 12:54:08

24小時熱門文章

最新文章

最新評論文章