趣談ResNeXt的泛化性能

我拿在ImageNet上預訓練過的ResNeXt101c64在6張日常圖片進行測試。它在ImageNet上的top1準確率是79.5%,top5準確率是94.6%,來自論文
第一張圖片是城市夜景,裏面有塔式鐘樓,位於水邊,水岸對面是一座山。ResNeXt以84%的概率認定這是一張拼圖,約5%概率認定爲海岸,2.6%的概率認定爲湖岸,1.9%的概率認定爲岬,0.8%的概率認定爲鑽井平臺。這個分類錯誤成分比較大。城市夜景
第二張圖片是兩位身着古裝的女性。模型以70%的可能認定爲有箍襯裙,以28%的可能性認爲是罩裙。模型把人物的穿着識別的八九不離十。古裝女性
第三張圖是達芬奇的名畫《最後的晚餐》。模型以76%的可能性把它認定爲拱頂,10%的可能性認定爲修道院。
最後的晚餐
第四張圖片模型分類對了,至少認出是犬。
犬
第五張圖是不知姓名的山脈。模型首先把它認爲是阿爾卑斯山,其次認爲是峽谷,再次是湖岸。這個模型的分類結果還算是可以。

山脈
第六張圖是上海浦東景色。模型首先認爲它是宮殿,其次是碼頭,再次是城堡,再次是清真寺,最後是鑽井平臺。這次分類結果完全錯了。上海浦東
總之,這樣的模型離通用的物體分類模型還有一定距離。目前的物體分類模型在受控的場景下有比較好的表現。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章