Karatsuba-Ofman乘法器

原創

2020-05-23 21:08

Karatsuba-Ofman乘法器是俄羅斯人Karatsuba於1962年提出的，主要思想是採用分治算法計算整數乘法，將計算複雜度向前推進到 $O(n^{log_23})$ ，而此前普遍認爲整數乘法的計算複雜度是 $O(n^2)$ 。
來看一個例子：假設 $n=2l$ ， $x=x_12^l+x_0$ ， $y=y_12^l+y_0$ 是 $2l$ -位整數，於是：
$xy=(x_12^l+x_0)(y_12^l+y_0)$
$=x_1\cdot y_12^{2l}+[(x_0+x_1)\cdot(y_0+y_1)-x_1y_1-x_0\cdot y_0]2^l+x_0y_0$
$xy$ 可以通過3個 $l$ -位的整數乘法（而不是 $2l$ -位的整數乘法）和2個乘法，2個減法算式計算出來。
若 $l$ 數值較大，加法和減法相對乘法的計算代價可以忽略。在經典算例中，程序可以反覆迭代到中位數，並一直執行到滿足閾值（可能的值是機器字長度）的條件才停止。
對於大小適中的整數，Karatsuba算法的執行上限是需要考慮的因素。不同於傳統方法，Karatsuba算法的執行儘可能減少移位請求（對於 $2^l$ 和 $2^{2l}$ 乘法），並且高效使用面向字節的操作。例如：採用拆分字節的邊界的方法有可能更好，一個指定階段的分裂可以拆分成2個以上片段。
例1（Karatsuba-Ofman方法）：考慮224-位整數 $x$ 和 $y$ 的乘法，運算設備的字節長度爲 $W=32$ 。2個深度爲2的方法展現如下圖所示，顯然，圖a的裂項從數學上看可能更爲優雅並且在代碼上更具備重用性。然而，卻需要更多的移位操作，這是因爲裂變並非以字長單位爲邊界進行。如果56-位數的乘法的代價近似於64-位數乘法，顯然裂項對於硬件容量利用不足，這是因爲如圖b所示，9個64位乘法與1個32位、8個64位乘法的代價完全不同。另外，圖b的列項建立在字長單位爲邊界的基礎上，由於存在加法移位，具有更多的複雜的跨項計算。例如，深度爲2的跨項具有形式

上圖展示了224-位的整數分裂成深度爲2的二叉樹。圖a所示的 $xy$ 乘積包括採用3個 $112*112$ 位乘法，每個執行又採用3個5656位的乘法。b圖所示的xy包括採用一個9696位乘法(列項爲一個3232位和2個6464位乘法)和2個128128位的乘法（每個產生3個 $64*64$ 位乘法）。
如下：
$(x_0+x_1)(y_0+y_1)-x_1y_1-x_0y_0$
其中， $x_0+x_1$ 和 $y_0+y_1$ 在圖a爲57-位數，在圖b爲65-位數。雖然 $(x_0+x_1)(y_0+y_1)$ 可以被1個6464位乘法和2個加法計算出來，圖b列項的代價仍然有點大。

上圖展現了192-位整數的深度爲2的裂項。圖a的乘法 $xy$ 具有3個 $96*96$ 的乘法，每個乘法執行1個 $32*32$ 和2個 $64*64$ 的乘法（每個乘法需要3個32*32位乘法），總共需要21個 $32*32$ 位乘法。圖b或圖c，僅需要18個 $32*32$ 位乘法就可以完成計算。
例2（192位數乘法）：考慮Karatsuba-Ofman算法應用於192-位整數乘法的例子，假設設備字長 $W=32$ 。按上圖所示的3個深度位2的方法，圖a需要21個 $32*32$ 位乘法，圖b和圖c只需要18個。主要的思路是 $3l$ -位整數 $x=x_22^2l+x_12^l+x_0$ 和 $y=y_22^{2l}+y_12^l+y_0$ 能夠計算如下：
有限域的乘法性能在橢圓曲線機制中是非常重要的。囿於硬件乘法器和傳播成本的限制，執行以上算法勢必會引起明顯的瓶頸。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Karatsuba-Ofman乘法器

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

科研論文投稿的那些事

Karatsuba-Ofman乘法器

質數域的算數運算

有限域算數運算

淺析：基於離散對數的橢圓曲線加密方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結