矩陣、浮點運算測試報告

原創

2020-02-23 16:08

轉載自：http://dev.21tx.com/2004/11/10/12460.html

1）使用D3DXMatrixMultiply進行矩陣相乘
2）使用優化的4元數算法模擬矩陣相乘（相乘的結果與1相同）
3）最笨的辦法計算矩陣相乘（要算64個乘法、48個加法、以及若干賦值）
4）使用SSE彙編計算矩陣相乘（要算64個乘法、48個加法、以及若干賦值）
5）使用xmmintrin指令集計算矩陣相乘

結果表明：
1）最快，估計不僅指令進行了優化，算法也進行了優化
2）是1的4～5倍，與3相比，證明算法起了作用
3）是1的10倍左右
4）與3差不多，我ft，這是爲什麼？我明明用的是彙編啊？怎麼速度一點也沒快！！！
5）與4差不多。

經驗教訓：
1）不能直接聲明float[4] f這樣的浮點數組，由於對其問題，在彙編語言中運行不了，應該這樣聲明__declspec(align(16)) float[4] f; 或者這樣聲明
union sse4 {
     __m128 m;
     float f[4];
};
2）那麼矩陣就是這樣聲明的了：
union sse16 {
     __m128 m[4];
     float f[4][4];
};

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

[CSS]CSS浮動塌陷及解決辦法

一. CSS浮動先看一個例子 <html !DOCTYPE> <head> <title>HTML2</title> <style> .div-outer {

2024-05-13 23:37:32

Java包裝類型

Java有8種基本數據類型，每種基本數據類型都提供了一種對應的包裝類型，從 Java 5 開始引入了自動裝箱/拆箱機制，使得二者可以相互轉換。原始類型: boolean，char，byte，short，int，long，float，do

2024-03-28 12:33:57

實現“代碼可視化”需要了解的前置知識-編譯器中端

1. 前言前文實現“代碼可視化”需要了解的前置知識-編譯器前端介紹了編譯器前端知識並附帶了小練習，本文將繼續介紹編譯器中端相關的知識，還是概念+練習的學習方式。中間代碼是用來進行程序分析和實現代碼可視化的關鍵數據，瞭解其生成和優化方式能

2024-05-21 11:56:05

CTF中常見的四種python逆向

說在前面：什麼是pyc文件？ pyc是一種二進制文件，是由py文件經過編譯後，生成的文件，是一種byte code，py文件變成pyc文件後，加載的速度有所提高，pyc 文件是 Python 編譯過的字節碼文件。它是 Python 程

2024-04-19 10:46:19

從CVE復現看棧溢出漏洞利用

最近復現了兩個棧溢出漏洞的cve，分別是CVE-2017-9430和CVE-2017-13089，簡單記錄一下real wrold中的棧溢出漏洞學習。目前，棧溢出漏洞主要出現在iot固件中，linux下的已經很少了，所以這兩個洞都是17年，

2024-04-12 10:45:32

深入理解Java JMM模型

併發和並行的含義目標都是最大化CPU的使用率並行(parallel) ：指在同一時刻，有多條指令在多個處理器上同時執行。所以無論從微觀還是從宏觀來看，二者都是一起執行的。併發(concurrency)：指在同一時刻只能

2024-04-07 13:06:58

如何學好知識

前言爲啥要寫這個呢，因爲寫程序也7-8年了，有一些感悟，想寫下來，雖然這個命題有點大，但是呢，我覺得並不誇張，下面進入正題。打好基礎其實就是學東西不管學什麼基礎纔是重要的，比如寫程序有的人會說能用就行，可是我覺

2024-03-23 11:54:39

矩陣爆破逆向之條件斷點的妙用

不知道你是否使用過IDA的條件斷點呢？在IDA進階使用中，它的很多功能都有大作用，比如：ida-trace來跟蹤調用流程。同時IDA的斷點功能也十分強大，配合IDA-python的輸出語句能夠大殺特殺！那麼本文就介紹一下這個功能點，使用z

2024-03-01 23:34:32

安卓動態鏈接庫文件體積優化探索實踐

背景介紹應用安裝包的體積影響着用戶下載量、安裝時長、用戶磁盤佔用量等多個方面，據Google Play統計，應用體積每增加6MB，安裝的轉化率將下降1%。安裝包的體積受諸多方面影響，針對dex、資源文件、so文件都有不同的優化策略，在

2024-02-05 12:42:33

智慧家庭場景的推薦系統的發展歷程和方向 | InfoQ《公開課》

直播概要：隨着計算機的蓬勃發展，互聯網進入大數據和人工智能時代，爲了解決信息過載和長尾商品，推薦系統成爲唯一選擇，而面對不同的業務場景，爲了解決業務痛點，會根據不同的場景特點尋找不同的方法和手段來解決推薦中實際遇到的問題。在智慧家庭領域，

InfoQ 中文站

2021-12-21 10:54:01

Alexa 全球排名網站將關閉，排名曾引爭議

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-14 14:53:55

Thinking Above Code：TLA+思維概述

{"type":"doc","content":[{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null

2021-12-07 17:23:58

你的2.6朵雲裏，會有火山引擎嗎？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-07 10:28:54

數字化轉型這麼火，你真的看懂了嗎？

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-12-02 21:08:57

基於圖像的機器學習技術將數十億的電子商務產品分爲數千個類別

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"typ

2021-11-29 16:28:50

24小時熱門文章

最新文章

最新評論文章