爲什麼 JavaScript 中 0.1+0.2 不等於 0.3 ?

本文首發於 vivo互聯網技術 微信公衆號 
鏈接:https://mp.weixin.qq.com/s/2kea7-jACCJmSYBQAwXyIg
作者:劉洋

在 js 中進行數學的運算時,會出現0.1+0.2=0.300000000000000004的結果,一開始認爲是浮點數的二進制存儲導致的精度問題,但這似乎不能很好的解釋爲什麼在同樣的存儲方式下0.3+0.4=0.7可以得到正確的結果。本文主要通過浮點數的二進制存儲及運算,和IEEE754下的舍入規則,解釋爲何會出現這種情況。

一、浮點數的二進制存儲

JavaScript遵循IEEE754標準,在64位中存儲一個數據的有效數字形式。

其中,第0位爲符號位,0表示正數1表示負數;第1到11位存儲指數部分;第12到63位存小數部分(尾數部分)(即有效數字)。由於二進制的有效數字總是表示爲 1.xxx…的形式,尾數部分在規約形式下的第一位默認爲1,故存儲時第一位省略不寫,尾數部分f存儲有效數字小數點後的xxx...,最長52位。因此,JavaScript提供的有效數字最長爲53個二進制位(尾數部分52位+被省略的1位)。
以0.1、0.2、0.3、0.4和0.7的二進制形式爲例:

0.1->0.0001100110011...(0011無限循環)->0-01111111011-(1 .)1001100110011001100110011001100110011001100110011010(入)
0.2->0.001100110011...(0011無限循環)->0-01111111100-(1 .)1001100110011001100110011001100110011001100110011010(入)
0.3->0.01001100110011...(0011無限循環)->0-01111111101-(1 .)0011001100110011001100110011001100110011001100110011(舍)
0.4->0.01100110011...(0011無限循環)->0-01111111101-(1 .)1001100110011001100110011001100110011001100110011010(入)
0.7->0.101100110011...(0011無限循環)->0-01111111110-(1 .)0110011001100110011001100110011001100110011001100110(舍)

對於52位之後進行舍入運算,此時可看作0舍1入(具體舍入規則在第三部分詳細說明),有精度損失。

二、對階運算

由於指數位數不同,運算時需要進行對階運算。對階過程略,0.1+0.2與0.3+0.4的尾數求和結果分別如下:

0.1+0.2->10.0110011001100110011001100110011001100110011001100111
0.3+0.4->10.1100110011001100110011001100110011001100110011001101

求和結果需規格化(有效數字表示),右規導致低位丟失,此時需對丟失的低位進行舍入操作:

0.1+0.2->1.00110011001100110011001100110011001100110011001100111->1.0011001100110011001100110011001100110011001100110100(入)
0.3+0.4->1.01100110011001100110011001100110011001100110011001101->1.0110011001100110011001100110011001100110011001100110(舍)

即:
00111->0100
01101->0110

此處同樣有精度損失。在這裏我們可以發現,0.3+0.4對階階運算且規格化後的運算結果與0.7在二進制中的存儲尾數相同(可對照尾數後幾位),而0.1+0.2的運算結果與0.3的存儲尾數不同,且0.1+0.2轉化爲十進制時結果爲0.300000000000000004。
此時,雖然0.1+0.2與0.3+0.4進行舍入操作的近似位都爲1,但一入一舍導致計算結果與“標準答案”的異同。

三、IEEE754標準下的舍入規則

維基百科對最近偶數舍入原則的解釋如下:舍入到最接近,在一樣接近的情況下偶數優先(Ties To Even,這是默認的舍入方式),即會將結果舍入爲最接近(精度損失最小)且可以表示的值,但是當存在兩個數一樣接近的時候,則取其中的偶數(在二進制中是以0結尾的)。

首先要注意的是,保留小數不是隻看後面一位或者兩位,而是看保留位後面的所有位。

如圖,可以看到近似需要看三位,保留位(近似後的最低位)、近似位(保留位的後一位)、粘滯位(sticky bit 近似位後的所有位進行或運算後看作一位)。
當粘滯位爲1時,舍入規則可以看作0舍1入,近似位爲0舍,近似位爲1入(即第一部分小數二進制存儲爲52位尾數時所進行的舍入操作)。
當粘滯位爲0時,若近似位爲0則捨去。
當粘滯位爲0時,若近似位爲1,無論舍入精度損失都相同,故需取捨入兩種結果中的偶數:保留位爲1時入,保留位爲0時舍(即第二部分對階運算規格化時的舍入操作)。

四、總結思考

由於IEEE754標準,這樣的“bug”不止在JavaScript中會出現,在所有采用該標準的語言中都會存在,實際編程中可以通過設置精度保留位數等方式解決。

更多內容敬請關注 vivo 互聯網技術 微信公衆號

注:轉載文章請先與微信號:labs2020 聯繫。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章