原创 動手學深度學習——多層感知機

多層感知機 多層感知機是一種簡單的神經網絡,包含輸入層、隱藏層以及輸出層。如下圖所示。 多層感知機的計算過程 輸入層爲小批量樣本X∈Rn×d\boldsymbol{X} \in \mathbb{R}^{n \times d}X∈

原创 動手學深度學習——softmax與分類模型

softmax基本概念 softmax是單層神經網絡,與線性迴歸相同,通常用於離散的分類問題。掌握softmax需要掌握模型、數據集、損失函數和優化函數四個方面。 softmax的使用場景 softmax一般用於離散分類問題,

原创 動手學深度學習——文本預處理

文本預處理 文本預處理是NLP中不可或缺的一項任務。文本預處理通常包括四個步驟:讀入文本、分詞、建立字典、將文本從詞序列轉換爲索引序列。 (1)讀入文本 import collections import re def read