原创 循環神經網絡之前向反向傳播算法

前面我們已經介紹了深度神經網絡和卷積神經網絡,這些算法都是前向反饋,模型的輸出和模型本身沒有關聯關係。今天我們學習輸出和模型間有反饋的神經網絡,循環神經網絡(Recurrent Neual Networks),其廣泛應用於自然語言

原创 知識圖譜嵌入(KGE)主流模型簡介

1. KGE簡介 目前(2020.03)知識圖譜嵌入研究方法衆多,本文將對其中的主流方法進行簡要介紹,如翻譯、雙線性、神經網絡、雙曲幾何、旋轉等。各方法細節請看原論文,文中錯誤歡迎指出,謝謝。 知識圖譜嵌入(Knowledge

原创 機器學習之決策樹(C4.5算法)

1.決策樹簡介 我們已有如下所示數據集,特徵屬性包含天氣、溫度、溼度、風速,然後根據這些數據去分類或預測能否去打高爾夫球,針對此類問題你會怎麼解決呢。 序號 天氣 溫度 溼度 風速 高爾夫 1 晴 炎熱 高 弱 進行

原创 LSTM如何解決RNN帶來的梯度消失問題

本篇文章參考於 RNN梯度消失和爆炸的原因、Towser關於LSTM如何來避免梯度彌散和梯度爆炸?的問題解答、Why LSTMs Stop Your Gradients From Vanishing: A View from t

原创 機器學習之SVM支持向量機(一)

我們思考這樣一個問題,給兩個標籤,藍色和紅色點,數據有兩個特徵(x,y)。我們想要一個分類器,給定一對(x,y),能找到很好的分類邊界,判斷是藍色點還是紅色點。對於下圖的數據,我們如何解決呢。本文通過引入Support Vecto

原创 機器學習之Logistic迴歸

1.Logistic迴歸簡介 線性迴歸能夠找到一個假設函數來估計原函數,從而根據特徵變量來得到假設值,但線性迴歸模型不能達到分類的效果。在線性迴歸的基礎上,我們將假設值和概率結合得到分類器,達到分類的效果。雖然Logistic迴歸

原创 機器學習之SVM支持向量機(二)

1.知識回顧 機器學習之SVM支持向量機(一)中我們介紹了SVM損失函數、最大間隔分類、爲什麼SVM能形成最大間隔分類器、核函數、SVM中Gaussian Kernel的使用知識點。上文我們從Logistic Regression

原创 Python之Sklearn使用教程

1.Sklearn簡介 Scikit-learn(sklearn)是機器學習中常用的第三方模塊,對常用的機器學習方法進行了封裝,包括迴歸(Regression)、降維(Dimensionality Reduction)、分類(Cl

原创 機器學習之線性迴歸

1.線性迴歸分析( Linear Regression Analysis) 線性迴歸分析(Regression Analysis):其數據集是給定一個函數和他的一些座標點,然後通過迴歸分析的算法,來估計原函數的模型,求得最符合這些

原创 機器學習知識體系

1.什麼是機器學習 機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行爲,以獲取新的知識或技能,重新組

原创 知識圖譜|298萬條三元組生成方法(一)

本篇文章接《Python爬蟲|Get豆瓣電影與書籍詳細信息》,學習如何利用爬取的數據,構建知識圖譜所需的三元組。主要內容包括如何從Json類型的數據,轉換成RDF數據,並最終存儲到Jena之中,然後利用SPARQL進行查詢。數據鏈接:

原创 Python爬蟲|Get豆瓣電影與書籍詳細信息

最近在做關於知識圖譜方面的實驗,需要一些數據,於是爬取了豆瓣上關於電影和書籍的信息。兩天時間內共爬取 20W+ 條數據,包括電影信息、電影演員信息、書籍信息、書籍作者信息,GitHub鏈接爲https://github.com/wei

原创 Ununtu16.04搭建GitLab服務器教程

Ununtu16.04搭建GitLab服務器教程 文章目錄Ununtu16.04搭建GitLab服務器教程1.依賴包安裝2.GitLab安裝2.1官方教程2.2清華源3.GitLab啓動4.GitLab配置4.1更改服務器IP地址4.

原创 機器學習降維之線性判別模型(LDA)

1.LDA簡介 線性判別分析(Linear Discriminant Analysis, LDA) 是一種監督學習的降維方法,也就是說數據集的每個樣本是有類別輸出。和之前介紹的機器學習降維之主成分分析(PCA)方法不同,PCA是不考慮

原创 機器學習之交叉驗證

1.交叉驗證簡介 交叉驗證(Cross Validation) 是在機器學習建立模型和驗證模型參數時常用的方法。顧名思義,就是重複的使用數據,把得到的樣本數據進行切分,組合爲不同的訓練集和測試集。用訓練集來訓練模型,測試集來評估模型的