原创 TensorFlow1.x入門(1)——計算圖的創建與啓動

系列文章 本教程有同步的github地址 0. 統領篇 1. 計算圖的創建與啓動 2. 變量的定義及其操作 3. Feed與Fetch 4. 線性迴歸 5. 構建非線性迴歸模型 6. 簡單分類問題 7. Dropout與優化器 8

原创 共指消解(一)

共指消解技術綜述摘要重點引言基本概念共指消解的研究現狀基於規則的方法Hobbs算法中心理論基於機器學習的方法監督學習無監督學習半監督學習基於全局最優化的方法基於知識庫的方法基於深度學習的方法總結與展望 摘要重點 共指消解旨在識別

原创 PyTorch入門(二)——張量的創建

張量的創建張量張量的定義Tensor與Variable張量的創建1.直接創建torch.tensor()torch.from_numpy(ndarray)2.依據數值創建torch.zeros()torch.zeros_like(

原创 TensorFlow1.x入門(2)——變量的定義及其操作

系列文章 本教程有同步的github地址 0. 統領篇 1. 計算圖的創建與啓動 2. 變量的定義及其操作 3. Feed與Fetch 4. 線性迴歸 5. 構建非線性迴歸模型 6. 簡單分類問題 7. Dropout與優化器 8

原创 TensorFlow1.x入門(4)——線性迴歸

系列文章 本教程有同步的github地址 0. 統領篇 1. 計算圖的創建與啓動 2. 變量的定義及其操作 3. Feed與Fetch 4. 線性迴歸 5. 構建非線性迴歸模型 6. 簡單分類問題 7. Dropout與優化器 8

原创 詞頻矩陣TfidfVectorizer結果與稀疏矩陣csr_matrix的遍歷

關係 TfidfVectorizer的結果是由csr_matrix這種方式組織的,在數據結構中稀疏矩陣的實現是csr_matrix。這是由於矩陣中有大量的0元素佔據了大量的空間,從而採用稀疏矩陣來壓縮空間。 csr_matrix可

原创 聚類效果評估——輪廓係數(Silhouette Coefficient)附Python代碼

輪廓係數前言是什麼?爲什麼?由此可得:怎麼用?不適用示例 前言 在機器學習中,無監督學習算法中聚類算法算作相對重要的一部分算法。也常在低資源和無標註的情況下使用。 其中KMeans作爲聚類算法中的一種,充當着重要的角色。由於其思想

原创 qt.qpa.screen: QXcbConnection: Could not connect to display localhost:18.0 Could not connect to any

Linux下有關matplotlib的問題問題Xshell中出現的問題問題點解決方法 問題 當你使用Xshell運行程序時突然有彈窗,並提示需要xmanager軟件來處理x11轉發請求,與此同時命令行輸出qt.qpa.screen

原创 TensorFlow1.x入門教程——統領篇

TensorFlow1.x入門教程前言你將得到什麼?系列文章地址後記 前言 TesnorFlow作爲深度學習的代表性的框架在業界被廣泛的使用,現在已經有1.x和2.x版本,由於1.x和2.x版本的差距較大(可以理解爲Python2

原创 TensorFlow1.x入門(11)——模型的保存與恢復

系列文章 1. 計算圖的創建與啓動 2. 變量的定義及其操作 3. Feed與Fetch 4. 線性迴歸 5. 構建非線性迴歸模型 6. 簡單分類問題 7. Dropout與優化器 8. 手動調整學習率與TensorBoard 9

原创 NLP系列文章(四)——文本的相似性度量

文本相似字面相似編輯距離最長公共子序列和最長公共子串Jaccard(傑卡德)相似度SimHash語義相似歐式距離和餘弦相似度詞移距離(WMD)DSSM 文本相似一般是指的,某一文本doc1doc1doc1與另一文本doc2doc2

原创 文本語義相似度衡量方法——詞移距離(Word Mover's Distance,WMD)

詞移距離什麼是詞移距離如何解釋詞彙移動的距離呢爲什麼採用詞移距離衡量文本相似度怎麼算詞移距離 什麼是詞移距離 詞移距離(Word Mover’s Distance,WMD)顧名思義就是詞彙移動的距離,它的提出本質上是用於衡量任意兩

原创 面試必考字符串相關的動態規劃——最大公共子序列、最大公共子串、編輯距離

字符串相關的動態規劃最大公共子序列最大公共子串編輯距離 簡述這三個算法解決的問題和展示狀態轉移方程並且給出可通過執行的Python代碼。 最大公共子序列 子序列是,一個字符串中的任意字符組成的序列,重點在於,不要求子序列是原字符串

原创 文本向量的距離測度——歐氏距離、曼哈頓距離、餘弦相似度

文本的常用距離測度歐氏距離曼哈頓距離曼哈頓距離和歐氏距離的區別餘弦相似度餘弦相似度和歐氏距離的區別 在NLP中文本均會被表示爲向量的形式,爲了給出任何兩個文本之間的相似程度,則可以利用各類的距離進行表示,其中最爲著名的兩種距離就是

原创 Jaccard距離和海明距離

兩種向量距離的測度Jaccard(傑卡德)相似度如何度量兩個向量之間的Jaccard相似度?特點海明距離 Jaccard(傑卡德)相似度 Jaccard相似度常用於計算兩個文本的字面相似度。將文本分爲詞的序列。兩個文本中一樣的詞彙