矩陣相乘
-
暴力算法:
代碼:
#include <stdio.h>
int main()
{
int A[2][2]={1,2,3,10};
int B[2][2]={5,6,6,6};
int C[2][2]={0};
int row=2;
int i=0,j=0,k=0;
for(i=0 ; i<row ; i++)
for(j=0 ; j<row ; j++){
C[i][j]=0;
for(k=0 ; k<row ; k++)
C[i][j]+= A[i][k]*B[k][j];
}
for(i=0 ; i<row ; i++)
for(j=0 ; j<row ; j++)
printf("%d ",C[i][j]);
printf("\n");
return 0;
}
O(n^3)
-
Strassen算法
矩陣C = AB,可寫爲
C11 = A11B11 + A12B21
C12 = A11B12 + A12B22
C21 = A21B11 + A22B21
C22 = A21B12 + A22B22
如果A、B、C都是二階矩陣,則共需要8次乘法和4次加法。如果階大於2,可以將矩陣分塊進行計算。耗費的時間是O(nE3)。
要改進算法計算時間的複雜度,必須減少乘法運算次數。按分治法的思想,Strassen提出一種新的方法,用7次乘法完成2階矩陣的乘法,算法如下:
M1 = A11(B12 - B12)
M2 = (A11 + A12)B22
M3 = (A21 + A22)B11
M4 = A22(B21 - B11)
M5 = (A11 + A22)(B11 + B22)
M6 = (A12 - A22)(B21 + B22)
M7 = (A11 - A21)(B11 + B12)
完成了7次乘法,再做如下加法:
C11 = M5 + M4 - M2 + M6
C12 = M1 + M2
C21 = M3 + M4
C22 = M5 + M1 - M3 - M7
全部計算使用了7次乘法和18次加減法,計算時間降低到O(nE2.81)。計算複雜性得到較大改進。
代碼:
#include <iostream>
using namespace std;
const int N=4; //常量N用來定義矩陣的大小
int main()
{
void STRASSEN(int n,float A[][N],float B[][N],float C[][N]);
void input(int n,float p[][N]);
void output(int n,float C[][N]); //函數聲明部分
float A[N][N],B[N][N],C[N][N]; //定義三個矩陣A,B,C
cout<<"現在錄入矩陣A[N][N]:"<<endl<<endl;
input(N,A);
cout<<endl<<"現在錄入矩陣B[N][N]:"<<endl<<endl;
input(N,B); //錄入數組
STRASSEN(N,A,B,C); //調用STRASSEN函數計算
output(N,C); //輸出計算結果
return 0;
}
void input(int n,float p[][N]) //矩陣輸入函數
{
int i,j;
for(i=0; i<n; i++)
{
cout<<"請輸入第"<<i+1<<"行"<<endl;
for(j=0; j<n; j++)
cin>>p[i][j];
}
}
void output(int n,float C[][N]) //據矩陣輸出函數
{
int i,j;
cout<<"輸出矩陣:"<<endl;
for(i=0; i<n; i++)
{
cout<<endl;
for(j=0; j<n; j++)
cout<<C[i][j]<<" ";
}
cout<<endl<<endl;
}
void MATRIX_MULTIPLY(float A[][N],floatB[][N],float C[][N]) //按通常的矩陣乘法計算C=AB的子算法(僅做2階)
{
int i,j,t;
for(i=0; i<2; i++) //計算A*B-->C
for(j=0; j<2; j++)
{
C[i][j]=0; //計算完一個C[i][j],C[i][j]應重新賦值爲零
for(t=0; t<2; t++)
C[i][j]=C[i][j]+A[i][t]*B[t][j];
}
}
void MATRIX_ADD(int n,float X[][N],floatY[][N],float Z[][N]) //矩陣加法函數X+Y—>Z
{
int i,j;
for(i=0; i<n; i++)
for(j=0; j<n; j++)
Z[i][j]=X[i][j]+Y[i][j];
}
void MATRIX_SUB(int n,float X[][N],floatY[][N],float Z[][N]) //矩陣減法函數X-Y—>Z
{
int i,j;
for(i=0; i<n; i++)
for(j=0; j<n; j++)
Z[i][j]=X[i][j]-Y[i][j];
}
void STRASSEN(int n,float A[][N],floatB[][N],float C[][N]) //STRASSEN函數(遞歸)
{
float A11[N][N],A12[N][N],A21[N][N],A22[N][N];
float B11[N][N],B12[N][N],B21[N][N],B22[N][N];
float C11[N][N],C12[N][N],C21[N][N],C22[N][N];
float M1[N][N],M2[N][N],M3[N][N],M4[N][N],M5[N][N],M6[N][N],M7[N][N];
float AA[N][N],BB[N][N],MM1[N][N],MM2[N][N];
int i,j;//,x;
if (n==2)
MATRIX_MULTIPLY(A,B,C);//按通常的矩陣乘法計算C=AB的子算法(僅做2階)
else
{
for(i=0; i<n/2; i++)
for(j=0; j<n/2; j++){
A11[i][j]=A[i][j];
A12[i][j]=A[i][j+n/2];
A21[i][j]=A[i+n/2][j];
A22[i][j]=A[i+n/2][j+n/2];
B11[i][j]=B[i][j];
B12[i][j]=B[i][j+n/2];
B21[i][j]=B[i+n/2][j];
B22[i][j]=B[i+n/2][j+n/2];
} //將矩陣A和B式分爲四塊
MATRIX_SUB(n/2,B12,B22,BB);
STRASSEN(n/2,A11,BB,M1);//M1=A11(B12-B22)
MATRIX_ADD(n/2,A11,A12,AA);
STRASSEN(n/2,AA,B22,M2);//M2=(A11+A12)B22
MATRIX_ADD(n/2,A21,A22,AA);
STRASSEN(n/2,AA,B11,M3);//M3=(A21+A22)B11
MATRIX_SUB(n/2,B21,B11,BB);
STRASSEN(n/2,A22,BB,M4);//M4=A22(B21-B11)
MATRIX_ADD(n/2,A11,A22,AA);
MATRIX_ADD(n/2,B11,B22,BB);
STRASSEN(n/2,AA,BB,M5);//M5=(A11+A22)(B11+B22)
MATRIX_SUB(n/2,A12,A22,AA);
MATRIX_SUB(n/2,B21,B22,BB);
STRASSEN(n/2,AA,BB,M6);//M6=(A12-A22)(B21+B22)
MATRIX_SUB(n/2,A11,A21,AA);
MATRIX_SUB(n/2,B11,B12,BB);
STRASSEN(n/2,AA,BB,M7);//M7=(A11-A21)(B11+B12)
//計算M1,M2,M3,M4,M5,M6,M7(遞歸部分)
//上面的是湊的過程,下面是求C11,C12 C21 C22
//其實就是通過湊式子來得到
// C11 = A11B11 + A12B21
//C12 = A11B12 + A12B22
//C21 = A21B11 + A22B21
//C22 = A21B12 + A22B22
MATRIX_ADD(N/2,M5,M4,MM1);
MATRIX_SUB(N/2,M2,M6,MM2);
MATRIX_SUB(N/2,MM1,MM2,C11);//C11=M5+M4-M2+M6
MATRIX_ADD(N/2,M1,M2,C12);//C12=M1+M2
MATRIX_ADD(N/2,M3,M4,C21);//C21=M3+M4
MATRIX_ADD(N/2,M5,M1,MM1);
MATRIX_ADD(N/2,M3,M7,MM2);
MATRIX_SUB(N/2,MM1,MM2,C22);//C22=M5+M1-M3-M7
for(i=0; i<n/2; i++)
for(j=0; j<n/2; j++)
{
C[i][j]=C11[i][j];
C[i][j+n/2]=C12[i][j];
C[i+n/2][j]=C21[i][j];
C[i+n/2][j+n/2]=C22[i][j];
} //計算結果送回C[N][N]
}
}