原创 【深度學習-學習筆記3】Running a Jupyter Notebook from a Remote GPU Server

在深度學習的過程中,我們肯定會遇到一個問題,那就是神經網絡太深導致參數過多,自己電腦的CPU帶不動,即使帶的動也需要非常多的時間,效率很低。 近期我所在的實驗室爲了解決這個問題,在阿里雲租了幾臺GPU服務器專門來給我們跑代碼做實驗

原创 【PyTorch學習筆記1】MNIST手寫數字識別之MLP實現

在本筆記中,我們將以多層感知機(multilayer perceptron,MLP)爲例,介紹多層神經網絡的相關概念,並將其運用到最基礎的MNIST數據集分類任務中,同時展示相關代碼。本筆記主要從下面四個方面展開: 文章目錄1

原创 【PyTorch學習筆記2】從多項式函數擬合實驗出發淺談“模型選擇、欠擬合和過擬合”問題

在本筆記中,我們將從簡單易懂的多項式函數擬合實驗出發,談一談如今做機器學習繞不開的三個重要概念:模型選擇、欠擬合和過擬合,並且進一步挖掘如何選擇模型、如何避免欠擬合和過擬合問題。本筆記主要從下面五個方面展開: 文章目錄1 模型選