關於float double的數據類型的細節，在處理轉換問題的時候非常有用

原創

mumu2010

2018-09-01 06:31

從存儲結構和算法上來講，double和float是一樣的，不一樣的地方僅僅是float是32位的，double是64位的，所以double能存儲更高的精度。任何數據在內存中都是以二進制（0或1）順序存儲的，每一個1或0被稱爲1位，而在x86CPU上一個字節是8位。比如一個16位（2 字節）的short int型變量的值是1000，那麼它的二進制表達就是：00000011 11101000。由於Intel CPU的架構原因，它是按字節倒序存儲的，那麼就因該是這樣：11101000 00000011，這就是定點數1000在內存中的結構。目前C/C++編譯器標準都遵照IEEE制定的浮點數表示法來進行float,double運算。這種結構是一種科學計數法，用符號、指數和尾數來表示，底數定爲2——即把一個浮點數表示爲尾數乘以2的指數次方再添上符號。下面是具體的規格： ````````符號位階碼尾數長度 float 1 8 23 32 double 1 11 52 64 臨時數 1 15 64 80 由於通常C編譯器默認浮點數是double型的，下面以double爲例：共計64位，摺合8字節。由最高到最低位分別是第63、62、61、……、0位：最高位63位是符號位，1表示該數爲負，0正； 62-52位，一共11位是指數位； 51-0位，一共52位是尾數位。按照IEEE浮點數表示法，下面將把double型浮點數38414.4轉換爲十六進制代碼。把整數部和小數部分開處理:整數部直接化十六進制：960E。小數的處理: 0.4=0.5*0+0.25*1+0.125*1+0.0625*0+…… 實際上這永遠算不完！這就是著名的浮點數精度問題。所以直到加上前面的整數部分算夠53位就行了（隱藏位技術：最高位的1 不寫入內存）。如果你夠耐心，手工算到53位那麼因該是：38414.4(10)=1001011000001110.0110101010101010101010101010101010101(2) 科學記數法爲：1.001……乘以2的15次方。指數爲15！於是來看階碼，一共11位，可以表示範圍是-1024 ~ 1023。因爲指數可以爲負，爲了便於計算，規定都先加上1023，在這裏， 15+1023=1038。二進制表示爲：100 00001110 符號位：正—— 0 ！合在一起（尾數二進制最高位的1不要）： 01000000 11100010 11000001 11001101 01010101 01010101 01010101 01010101 按字節倒序存儲的十六進制數就是： 55 55 55 55 CD C1 E2 40

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

關於float double的數據類型的細節，在處理轉換問題的時候非常有用

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

C語言類型修飾符在這個上邊喫大虧了啊 volatile

Debug 和 Release 區別

C語言類型修飾符在這個上邊吃大虧了啊 volatile

ddraw顯示詳解

關於float double的數據類型的細節，在處理轉換問題的時候非常有用

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結