神經網絡參數遷移與慣性質量

原創

2020-05-16 21:16

作一個二分類網絡分類mnist的0和1，但用這個網絡來分類其他對象，比如（0，2），（0，3），（0，4），實現參數遷移。這種操作是否有什麼物理意義？

通過固定收斂標準多次測量取平均值的辦法計算這個網絡分類02，03，04的分類準確率，

得到表格

把分類準確率畫成圖

平均分類準確率Pave 02>03>04

按照假設2：

對應不同的兩個對象，迭代次數越大，二者的相對速度越大；相對速度越大分類準確率越大。

比如當收斂標準爲1e-5的，02的分類準確率爲0.738，04的分類準確率爲0.579.按照假設2，可以得出02粒子對的相對速度>04粒子對的相對速度。

因爲收斂標準是一樣的，可以合理假設對這兩個粒子對做的功是一樣的。因此可以得出02粒子對的質量<04粒子對的質量。

也就是分類準確率越大粒子對質量越小。

因此可以假設網絡(0,1)-81*10*2-(1,0)(0,1)構成的分類場形成了一個慣性系統，參數遷移相當於測量其他對象在這個慣性系統裏的慣性質量。

就像不同質量的人在電梯裏，當電梯上升時感受到的力應該是不同的。

從形態上看4和1最像，2和1的形態差異最大。因此4和1的波函數的等效交叉程度最大，所以粒子對02，03，04在01的慣性系中擁有的慣性質量順序04>03>02.

或者至少用慣性質量解釋參數遷移這件事是邏輯連貫的。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.