原创 CNN模型分析 | 4 Network In Network

ZFNet網絡綜述 前言 卷積神經網絡(CNN)由卷積層和池化層交替組成。卷積層使用線性濾波器和底層receptive field做內積,然後接一個非線性的激活函數,得到的輸出稱作特徵圖(feature map)。 CNN的卷積

原创 卷積神經網絡---LeNet

文章目錄Convolutional Neural NetworksLeNet 模型獲取數據和訓練模型總結: Convolutional Neural Networks 使用全連接層的侷限性: 圖像在同一列鄰近的像素在這個向量中可

原创 利用python實現對連續特徵的分箱操作(數據離散化)

1. 數據分箱 1.1 等區間分箱 將連續變量的值進行獲取,然後利用pandas的cut函數進行等區間分箱。 如下代碼,獲取值A2_values ,並等數值區間分爲6類爲[0,1,2,3,4,5]; (cut在操作時,統計了一維數

原创 關於ArchLinux和manjaro在安裝opencv時的過程與踩坑

關於ArchLinux和manjaro在安裝opencv時的過程與踩坑下載opencv安裝依賴包編譯安裝配置opencv環境測試版本安裝環境進行測試參考鏈接 manjaro雖說好用,畢竟用的人太少,安裝opencv的博客都沒幾篇,

原创 卷積神經網絡AlexNet-VGG-GoogLeNet詳解

文章目錄深度卷積神經網絡(AlexNet)AlexNet載入數據集訓練使用重複元素的網絡(VGG)VGG11的簡單實現⽹絡中的⽹絡(NiN)GoogLeNetGoogLeNet模型 深度卷積神經網絡(AlexNet) LeNet:

原创 線性迴歸-softmax分類-多層感知機-模型選擇和優化問題

文章目錄線性迴歸算法實現的基本要素模型數據集損失函數優化函數 - 隨機梯度下降softmax的基本概念分類問題權重矢量神經網絡圖類別輸出問題小批量矢量計算表達式交叉熵損失函數多層感知機的基本知識隱藏層表達公式激活函數模型選擇、過擬

原创 梯度消失和梯度爆炸

文章目錄梯度消失、梯度爆炸如何解決梯度消失和梯度爆炸問題隨機初始化模型參數PyTorch的默認隨機初始化Xavier隨機初始化考慮環境因素協變量偏移標籤偏移概念偏移 梯度消失、梯度爆炸 梯度消失和梯度爆炸 考慮到環境因素的其他問

原创 自然語言處理---文本預處理

文章目錄文本預處理讀入文本分詞建立字典將詞轉爲索引用現有工具進行分詞 文本預處理 文本是一類序列數據,一篇文章可以看作是字符或單詞的序列,本節將介紹文本數據的常見預處理步驟,預處理通常包括四個步驟: 讀入文本 分詞 建立字典,將

原创 Haar-like特徵計算和積分圖詳解

目錄1. 前言2. Haar-like特徵做檢測的基本步驟3. Haar-like特徵4. 積分圖計算原理解析(一目瞭然)5. Haar-like特徵值計算(積分圖應用) 1. 前言 目前人臉檢測的方法主要有兩大類:基於知識和基於

原创 自然語言處理---語言模型

文章目錄語言模型語言模型n元語法語言模型數據集讀取數據集建立字符索引時序數據的採樣隨機採樣相鄰採樣 語言模型 一段自然語言文本可以看作是一個離散時間序列,給定一個長度爲TTT的詞的序列w1,w2,…,wTw_1, w_2, \ld

原创 類別變量賦予唯一的數字ID

爲每個類別變量賦予唯一的數字ID sklearn.preprocessing.LabelEncoder的使用 from sklearn import preprocessing from sklearn.ensemble impo

原创 關於Pandas使用的一些查漏補缺

最近閒來無事,決定刷一刷kesci和鯨平臺的一套關於pandas的一套練習題,這是我所見過學習和練習入門pandas的最佳資料,推薦各位初學者可以去刷一刷,相見恨晚吶! 資料鏈接: 這十套練習,教你如何使用Pandas做數據分析

原创 類別特徵的各種處理總結

持續更新。。。 文章目錄1. one-hot(獨熱)編碼1.1 爲什麼要獨熱編碼?1.2 爲什麼特徵向量要映射到歐式空間?1.3 獨熱編碼優缺點1.4 什麼情況下(不)用獨熱編碼?1.5 什麼情況下(不)需要歸一化?1.6 one

原创 利用pytorch實現多分類器

%matplotlib inline 訓練分類器 就是這個。您已經瞭解瞭如何定義神經網絡,計算損耗並更新網絡權重。 現在你可能在想 數據怎麼樣? 通常,當您必須處理圖像,文本,音頻或視頻數據時,您可以使用標準的python包將數

原创 關於pytorch中torch.utils.data的認識

torch.utils.data class torch.utils.data.Dataset 表示Dataset的抽象類。 所有其他數據集都應該進行子類化。所有子類應該override__len__和__getitem__,前