網絡收斂問題彙總

原創

2018-10-10 07:46

loss太大：把lr改小

loss的下降速度非常慢：batchsize太小

訓練集的損失已經下降到比較滿意的值，但是（！！！！）驗證集上的損失幾乎沒有下降，或者是說相比與訓練集的損失值不在一個數量級上！！！

最本質的原因：網絡模型在小數據庫上出現過擬合。

訓練數據太少

精度不高或者爲0的問題結果

來自 <http://www.cnblogs.com/hust-yingjie/p/6535078.html>
https://blog.csdn.net/yang_502/article/details/72566168
https://blog.ailemon.me/2018/04/09/deep-learning-the-ways-to-solve-underfitting/

深度學習的效果很大程度上取決於參數調節的好壞

來自 <https://www.zhihu.com/question/25097993>

數據增廣
https://blog.csdn.net/timeflyhigh/article/details/52015175

訓練過程中train loss不斷下降，然而test loss卻不斷升高，還有就是accuracy並不是很高只有60%
過擬合
來自 <http://caffecn.cn/?/question/1265>
train loss與test loss結果分析
來自 <https://blog.csdn.net/SMF0504/article/details/71698354>
設置過優化函數sgd（使用adam也不收斂），且必須使dropout爲0，訓練集纔開始收斂
來自 <https://blog.csdn.net/u010911921/article/details/71079367/>

解決過擬合
http://zongweiz.leanote.com/post/%E6%B7%B1%E5%BA%A6%E7%BD%91%E7%BB%9C%E7%9A%84%E8%BF%87%E6%8B%9F%E5%90%88%E9%97%AE%E9%A2%98%E8%AE%A8%E8%AE%BA

如果訓練誤差曲線和測試誤差曲線之間有很大的空隙，說明你的模型可能有過擬合的問題。

來自 <https://keras-cn.readthedocs.io/en/latest/for_beginners/FAQ/#_3>

增加訓練數據集用個參數少點的模型對損失函數增加懲罰項

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

自然語言處理-多分類模型搭建

文章目錄一\介紹二\數據處理思路讀取數據提取char和word,轉化爲txt利用上面的txt, 使用word2vec生成模型對每句話根據上面生成的模型,得到對應的向量利用re正則匹配將csv中的word和char做成list,將l

2020-07-03 15:42:14

python連接sqlserver數據庫

python連接sqlserver數據庫 1、python3.6連接sqlserver數據庫需要引入pymssql模塊 2、 pip install pymssql pymssql儘量和自己的python版本一致，我的版本是py

2020-07-02 01:34:40

Tensorflow七種初始化函數

一、tf.constant_initializer(value) 作用：將變量初始化爲給定的常量，初始化一切所提供的值。二、tf.zeros_initializer() 作用：將變量設置爲全0；也可以簡寫爲tf.Zeros()

2020-07-02 01:34:38

RNN循環神經網絡相關知識

循環神經網絡是啥循環神經網絡種類繁多，我們先從最簡單的基本循環神經網絡開始吧。基本循環神經網絡下圖是一個簡單的循環神經網絡如，它由輸入層、一個隱藏層和一個輸出層組成：納尼？！相信第一次看到這個玩意的讀者內心和我一樣是崩潰

2020-07-02 01:34:38

圖注意力模型GAT代碼分析（Keras版）

本文分享一個對Keras版GAT源碼的分析。 GAT原文：https://arxiv.org/abs/1710.10903，建議參考着知乎superbrother大神的文章進行理解。 TensorFlow版可以看：https://gith

翻滚的老鼠屎

2020-06-30 03:30:27

深度學習實戰筆記一：google colab使用入門+mnist數據集入門+Dense層預測

首先kexue上網，進入google雲端硬盤新建->更多->Google Colaboratory 創建了一個新的.ipynb文件可修改該文件的名稱使用google colab的GPU 運行代碼，點擊鏈接，操作

用之有弗盈

2020-06-27 21:12:58

深度學習實戰筆記三：編碼器、解碼器+mnist+kears

對matplotlib的解釋 import matplotlib.pyplot as plt import numpy as np a = [[1,2]] a = np.array(a) c = a[:,0]#‘：'表示：不管a中

用之有弗盈

2020-06-27 21:12:57

深度學習實戰筆記四：在自己處理的數據集上訓練CNN網絡並進行預測

#cnn 識別狗狗類別 #用類構造代碼 #dog圖片的訓練、保存 #預測以及結果輸出 import os import numpy as np from PIL import Image from keras.models im

用之有弗盈

2020-06-27 21:12:57

深度學習實戰筆記二：keras+cnn+mnist cnn模型的創建、保存、調用

google colab的使用、文件路徑設置參見上一篇博客：深度學習筆記一：google colab使用入門+mnist數據集入門+Dense層預測本節筆記參考了Mike高的視頻一個完整的cnn模型 #CNN mnist im

用之有弗盈

2020-06-27 21:12:57

postgresql（psql） windows安裝+ MIMIC III 下載+導入數據庫

本文參考了shuaban的視頻先總結步驟如下：先在psql官網下載數據庫安裝包根據大家反饋導入數據其他版本有問題，最好下載9.6版本安裝：下載之後一般安裝就行安裝過程值得注意的三點： ① 設置數據庫軟件的安裝位置

用之有弗盈

2020-06-27 21:12:46

從代碼案例入門keras1:LeNet對手寫數字Mnist分類

本系列文章適合有深度學習基礎（上過課，看得懂代碼，但是想自己上手覺得困難的初學者）首先上LeNet論文： ===Y. LeCun, L. Bottou, Y. Bengio, and P. Haffner. (1998).Gradi

2020-06-27 06:26:38

查找海外人工智能相關資訊時可能會遇到的日語英語專業名詞術語整理（不定期更新）

大家可能日常xx上網翻閱一些國外的文獻參考，也需要搜索一些關鍵詞，這裏整理一些常用詞彙的中，日，英表現以供參考。由於留學狗平時時間也不多，所以不定期更新，多多諒解。（全是我一個一個手打的，轉載請標明出處）狀態空間表達式 state

2020-06-27 06:26:38

keras深度學習入門筆記附錄1：讓我們看看有多少種讓搭建好的模型開始跑的方式（fit 和 train on batch）

https://blog.csdn.net/timcanby/article/details/103620371 上一篇文章我們介紹了怎麼用keras寫一個最簡單的數字分類網絡，但是可能有同學會說我怎麼在不同地方看到的大家跑模型的方法都不

2020-06-27 06:26:38

keras入門筆記2:我們來玩卷積層（ Convolution Layer）～一層卷積層分類Mnist！

哈囉哈囉～繼之前的： keras深度學習入門筆記附錄1：讓我們看看有多少種讓搭建好的模型開始跑的方式（fit 和 train on batch） https://blog.csdn.net/timcanby/article/details

2020-06-27 06:26:38

深度學習入門之基本概念

1、機器學習：根據我的理解，機器學習就是讓電腦自動學習或者是訓練出一個好的模型來解決實際問題。圖一機器學習如上圖所示，模型類似於函數，輸入可能爲向量（圖像矩陣轉化爲向量輸入），輸出可能爲離散值如分類問題（比如手寫數字預測），也

2020-06-26 19:01:10

24小時熱門文章

最新文章

最新評論文章