c/c++ float和double的表示範圍詳細解析

原創

2020-07-01 15:45

開門見山

float範圍： 最小負數-2*2^127 最大負數-1*2^(-126)，0
最小正數 1*2^(-126) 最大正數2*2^(127)。

double範圍： 負數：（-1.7976931348623157E+308，-4.94065645841246544E-324）；
零：0 ；
正數：（4.94065645841246544E-324，1.7976931348623157E+308）。
即絕對值爲0和2^1022——2^1024。

精度：

float和double的精度是由尾數的位數來決定的；
浮點數在內存中是按科學計數法來存儲的，其整數部分始終是一個隱含着的“1”，由於它是不變的，故不能對精度造成影響；
float：2^23 =8388608，共七位，意味着最多能有7位有效數字，但絕對能保證的爲6位，也即float的精度爲6~7位有效數字；
double：2^52 = 4503599627370496，一共16位，同理，double的精度爲15~16位。

原因

float：1bit（符號位）+8bits（指數位)+23bits（尾數位）；
double：1bit（符號位）+ 11bits（指數位）+ 52bits（尾數位）。
以float爲例，階碼(指數)用移碼來表示，8位移碼（偏移量爲127）本來應該可以表示-128-127，但是全0和全1被用來表示特殊狀態的指數，所以爲-126-127（無符號8位表示0-255，去除全0和1後是1-254，減去偏移量127，就是-126-127）。這裏爲什麼要使用127來作爲偏移量，若使用128 則8位移碼錶示範圍-127~126，由於表示一個大的正數比一個小的負數更加重要，所以127作爲偏移量比較合適。現在可以計算其表示範圍了：尾數部分的取值範圍[1,2),所以最小負數-2*2^127 最大負數-1*2^(-126) 最小正數 1*2^(-126) 最大正數2*2^(127)

可以看下這篇文章鏈接，文章有些內容錯誤，多注意下。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

c/c++ float和double的表示範圍詳細解析

開門見山

原因

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

free AI online tools All In One

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

HTML 00 Tutorial

全面系統的AI學習路徑，幫助普通人也能玩轉AI

從零開始：使用 Playwright 腳本錄製實現自動化測試

uni-app實現上拉加載

Mysql數據類型與選擇規則（mysql5.7）

node處理圖片和PDF文件方法

MySql事務在併發情況下出現的異常及解決方法

Mysql 行鎖（記錄鎖、間隙鎖、臨鍵鎖）研究，基於InnoDB

MySql事務基礎知識（併發問題）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結