原创 推薦評論展示(短文本二分類)

目錄   一、題目描述 1.1 背景描述 1.2 數據集 1.3 評測指標 二、解題思路 2.1 ML/DL的前提假設 2.2 主要思路 2.3 進一步的改進 三、動手實踐 四、全部代碼 一、題目描述 1.1 背景描述 本次推薦評論展示任

原创 文本分類 & 數據增強 & 模型微調

目錄   一 文本分類 1.1 BiLSTM 1.2 TextCNN 二 數據增強 2.1 常用的圖像增廣方法 2.2 注意事項 2.3 圖像增廣的優點是什麼?爲什麼要用圖像增廣? 三 模型微調 3.1 什麼是微調(fine-tune)?

原创 優化算法進階 & word2vec & 詞嵌入進階

問答學習,自問自答~ 一 優化算法進階 什麼是ill-condition?如何判斷出現了ill-condition?有什麼危害? 學習率決定了優化的快慢 如何應對ill-condition? 什麼是Momentum方法(SGD

原创 批量歸一化和殘差網絡 & 凸優化 & 梯度下降

本節以問題的形式來自問自答 一 批量歸一化和殘差網絡 1.1 BatchNormalization(批歸一化,簡稱BN) 論文《Batch normalization: Accelerating deep network training

原创 卷積神經網絡基礎 & leNet & 卷積神經網絡進階

本文主要講卷積神經網絡,卷積神經網絡的優點是什麼呢? 可以並行 與全連接網絡相比,能更好的捕捉局部的空間信息,隨着層數的增加,在輸入上的感受野會增大 與全連接網絡相比,參數量更少。 一 卷積神經網絡基礎 本節以二維卷積爲例,二維卷積常用於

原创 Docker跨服務器遷移

有時候需要換一臺服務器運行自己的代碼,但又不想重新配置環境,這時候就可以把自己的docker移到相應的服務器上去,有點即插即用的感覺。 假定現在要把服務器A上的docker複製到服務器B上……只需五步 step 1 在A上把當前的容器提交

原创 Word2Vec原理

本篇不是入門型文章,僅記錄關於word2vec的一點思考,歡迎大家一起討論。爲了更好地表達,本文會採用cs224n官網以及劉建平老師的博客中的一些圖片,在下面的介紹中不再一一註明出處。 目錄 一、原始的word2vec模型架構 二、原始w

原创 Tensorflow RNN結構 解讀

RNN的結構非常多,論文《An Empirical Exploration of Recurrent Network Architectures》中評估了10000種RNN結構。這裏我們僅看一下比較流行的LSTM、GRU和多層RNN結構的

原创 Python 傳值or傳引用

傳值與傳引用這件事情,不止是python,任何程序語言都要格外注意,但python中格外令人頭疼,一不小心就成了傳引用,致使兩個變量同步變量,故而造成bug,且是不易察覺的bug。 目錄 1 numpy中的傳值與傳引用 2 pandas中

原创 《閃光少女》觀後感

《閃光少女》這部電視劇裏讓我印象最深刻的兩個人是女主A和女主的姐姐B。 A是一個敢愛敢恨,敢拼敢打的女生,當她喜歡一個男生的時候,大膽的表白,最壞的結果也不過是被拒絕罷遼;當她想要組建一個樂隊的時候,她想盡一切辦法找樂隊成員,發傳單、口頭

原创 機器翻譯及相關技術 & 注意力機制與Seq2seq模型 & Transformer

目錄 一 機器翻譯及相關技術 二 注意力機制與Seq2seq模型 2.1 注意力機制 2.2 seqseq模型 2.3 動手實踐(tensorflow版本) 2.3.1 實現attention機制(要求能夠處理變長輸入序列) 三 Tran

原创 線性迴歸 & Softmax與分類模型 & 多層感知機

目錄 一、線性迴歸 1 線性迴歸 2 動手實踐 2.1 儘量使用矢量/矩陣運算,提高計算效率 2.2  Pytorch 梯度累積機制 二 Softmax與分類模型 1 Softmax 2 分類模型 3 動手實踐 (1)廣播機制 (2)關於

原创 過擬合、欠擬合及其解決方案 & 梯度消失、梯度爆炸 & 循環神經網絡進階

目錄 一過擬合、欠擬合及其解決方案 1.1 欠擬合與過擬合 1.2 過擬合解決方案 1.3 欠擬合解決方案 二 影響模型效果的因素 2.1 梯度消失&梯度爆炸 概念 梯度消失解決方法 梯度爆炸解決方法 2.2 環境因素 協變量偏移 標籤偏

原创 文本預處理 & 語言模型 & 循環神經網絡基礎

這部分內容是文本生成技術的基礎,也是我的科研內容。嘻嘻嘻=-= 在線性迴歸 & Softmax與分類模型 & 多層感知機中提到,建模的pipeline包括8個步驟,從大方向來看,可以歸爲2類,第1步(準備數據集)歸爲一類,called“數

原创 Linux磁盤分區與掛載

多年以前學習過windows系統的磁盤分區,劃分爲D,E,F盤並給每個盤重命名,C盤默認爲系統盤,如果以後重裝系統,C盤的文件會重置,而其他盤的文件不受任何影響。其實Linux系統也是一樣的,磁盤分區有助於更好的管理硬盤上的系統和文件,如