float壓縮方式

原創

2020-06-15 16:00

float在捨棄一些精度和範圍的情況下，可以做些壓縮，節省存儲空間。本文介紹3種壓縮方式：fp16,Int8，fp block

float存儲格式

V = (-1) ^ s × M × 2 ^ E

（1）(-1)^s 表示符號位，當 s=0，V 爲正數；當 s=1，V 爲負數。

（2）M 表示有效數字，大於等於 1，小於 2，但整數部分的 1 不變，因此可以省略。

（3）2^E 表示指數位。

比如：對於十進制的 5.25 對應的二進制爲：101.01，相當於：1.0101*2^2。所以，S 爲 0，M 爲 1.0101，E 爲 2。

對於float 32位存儲，M爲23Bit，E爲8bit，s 1bit，具體存儲格式，見下圖：

則，我們可以計算出，float的值範圍爲：[-3.4*10^38,-1.18*10^-38]U[1.18*10^-38,3.4*10^38]

fp16壓縮：

半精度浮點數 是一種被計算機使用的二進制浮點數據類型。半精度浮點數使用2個字節（16位）來存儲。

在IEEE 754-2008中，它被稱作binary16。這種數據類型只適合存儲對精度要求不高的數字，不適合用來計算。

IEEE 754 標準指定了一個 binary16 要有如下的格式：

Sign bit（符號位）： 1 bit
Exponent width（指數位寬）： 5 bits
Significand precision（尾數精度）： 11 bits （有10位被顯式存儲）

按如下順序排列：

最大值爲：0 11110 1111111111=(-1)^0 * 2^15 * (1+1-2^-10)=65504

正數最小值爲：0 00001 0000000000=2^-14=6.10 * 10^-5

int8壓縮：

根據float的range，將int8 128bit，平均分，存儲float的值，精度損失與float的range範圍相關。

block fp壓縮：

針對多float的存儲做壓縮，統計系列數的最大指數（Exponent），並統一存儲一個指數，統計其他的小數位（Fraction），此壓縮適合於系列float值相差較少的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

從NoSQL到NewSQL——10年代大數據浪潮下的技術革新

引言在數字化浪潮的推動下，數據庫技術已成爲支撐數字經濟的堅實基石。騰訊雲 TVP《技術指針》聯合《明說三人行》特別策劃的直播系列——【中國數據庫前世今生】，我們將通過五期直播，帶您穿越五個十年，深入探討每個時代的數據庫演變

2024-04-28 23:12:26

“百團大戰”下，20年代的國產數據庫如何乘風破浪？

引言在數字化浪潮的推動下，數據庫技術已成爲支撐數字經濟的堅實基石。騰訊雲 TVP《技術指針》聯合《明說三人行》特別策劃的直播系列——【中國數據庫前世今生】，我們將通過五期直播，帶您穿越五個十年，深入探討每個時代的數據庫

2024-04-28 23:12:24

Hive存儲過程實現-hpsql

1. 什麼是hpsql 目前版本的hive中沒有提供類似存儲過程的功能，使用Hive做數據開發時候，一般是將一段一段的HQL語句封裝在Shell或者其他腳本中，然後以命令行的方式調用，完成一個業務或者一張報表的統計分析。好消息是，

2023-08-01 00:03:02

一文讀懂OSS、NAS、EBS有什麼區別?

近期，AIGC、GPT大模型、數據中臺等熱點話題備受關注，那麼具體在不同的行業場景下，如何選擇對應的存儲介質呢？選型的時候該考慮哪些因素呢？通過本文主要介紹常用的存儲類型及它們之間的對比差異，輔助幫助大家在不同需求和場景下選擇合適的存儲類型

2023-07-20 00:40:22

JimuReport積木報表 v1.5.9版本發佈—免費的數據可視化報表

項目介紹一款免費的數據可視化報表，含報表和大屏設計，像搭建積木一樣在線設計報表！功能涵蓋，數據報表、打印設計、圖表報表、大屏設計等！ Web 版報表設計器，類似於excel操作風格，通過拖拽完成報表設計。秉承“簡單、易用、專業”的產

2023-07-18 13:17:31

JimuReport積木報表 v1.5.8版本發佈—免費的數據可視化報表

項目介紹一款免費的數據可視化報表，含報表和大屏設計，像搭建積木一樣在線設計報表！功能涵蓋，數據報表、打印設計、圖表報表、大屏設計等！ Web 版報表設計器，類似於excel操作風格，通過拖拽完成報表設計。秉承“簡單、易用、專業”的產

2023-05-11 14:07:50

設計模式整理--適配器模式

前言對於適配器其實很常見, 比如生活中的筆記本電腦的充電器, 他的作用就是將220v的電壓轉換成19v的電壓, 提供給筆記本來使用, 電這個抽象類有提供能源的功能, 但是不同的用電器具有不同的電壓屬性. 所以需要一個轉接器. 這個轉接器

2022-04-30 14:15:03

不容錯過！Greenplum的又一本好書

Greenplum數據庫是基於MPP架構的開源大數據平臺，具有良好的彈性和線性擴展能力，內置並行存儲、並行通信、並行計算和並行優化功能，兼容SQL標準，具有強大、高效的PB級數據存儲、處理和實時分析能力，同時支持涵蓋OLTP型業務的混合負載

2022-04-30 11:09:52

Redis入門：簡介

Redis入門：簡介 1、介紹 nginx+tomcat集羣可以實現10萬-百萬的併發訪問量；目前的架構不能承受如此海量的訪問，瓶頸還是在數據庫，尤其是查詢。要想突破數據庫的瓶頸，就需要使用緩存技術。 Redis是分佈式的、nosql、ke

2022-04-30 10:09:31

Spring-org.springframework.core.env.PropertyResolver

PropertyResolver 該接口用於解析Spring項目中一系列的基礎屬性。例如properties文件,yaml文件,甚至是一些nosql（因爲nosql也是k-v形式）。接口中定義了一系列讀取，解析，判斷是否包含指定屬性的方

2022-04-30 09:52:37

製作報表可以使用哪些數據庫？積木報表15種數據庫類型任你選！

製作報表過程中，我們經常會遇到需要從不同數據庫中獲取數據，這樣報表製作起來也會比較方便。積木報表支持的數據庫類型不僅包含關係型數據庫，也包含非關係型數據庫及國產數據。今天就讓我們來看一下積木報表都支持哪些數據庫吧。 1.關係型數據庫 m

2022-04-30 06:26:38

阿里IM技術分享(六)：閒魚億級IM消息系統的離線推送到達率優化

本文由阿里閒魚技術團隊逸昂分享，原題“消息鏈路優化之弱感知鏈路優化”，有修訂和改動，感謝作者的分享。 1、引言閒魚的IM消息系統作爲買家與賣家的溝通工具，增進理解、促進信任，對閒魚的商品成交有重要的價值，是提升用戶體驗最關鍵的環節。然

2021-12-25 21:40:48

MySQL千萬級大表優化，別人是這樣咋做的！

點擊上方“小羅技術筆記”，關注公衆號第一時間送達實用乾貨問題概述使用阿里雲rds for MySQL數據庫（就是MySQL5.6版本），有個用戶上網記錄表6個月的數據量近2000萬，保留最近一年的數據量達到4000萬，查詢速度

2021-12-25 21:33:08

分佈式架構中的三高：高併發、高性能、高可用

關於高併發高併發場景互聯網應用以及雲計算的普及，使得架構設計和軟件技術的關注點從如何實現複雜的業務邏輯，轉變爲如何滿足大量用戶的高併發訪問請求。一個簡單的計算處理過程，如果一旦面對大量的用戶訪問，整個技術挑戰就會變得完全不同，軟件

2021-12-25 21:28:11

企業級消息平臺化-事務消息篇

一、背景事務消息的定義：在RabbitMQ中的事務消息是指多條消息的事務原子性分佈式事務，本地事務和消息中間件的一致性本篇主要說的是本地事務和消息中間件的一致性，即分佈式事務中的可靠性消息解決方案二、分佈式事務的理論 CAP

2021-12-25 21:17:12

24小時熱門文章

最新文章

最新評論文章