1、神经网络的本质是做线性变换(有激活函数就是非线性变换)。线性变换的本质就是:矩阵乘法。
2、因此,训练和预测时,需要保证输入的数据是矩阵形式。训练时,batch*input_dim是二维。预测时,需要对输入的tensor或者numpy增加一个维度。
3、list的加法+,本质是list合并,所以每个元素都应该是一个list。里面的元素如果不是二维的numpy应该转成二维numpy,这样才能做矩阵乘法。
1、神经网络的本质是做线性变换(有激活函数就是非线性变换)。线性变换的本质就是:矩阵乘法。
2、因此,训练和预测时,需要保证输入的数据是矩阵形式。训练时,batch*input_dim是二维。预测时,需要对输入的tensor或者numpy增加一个维度。
3、list的加法+,本质是list合并,所以每个元素都应该是一个list。里面的元素如果不是二维的numpy应该转成二维numpy,这样才能做矩阵乘法。