原创 基於協同過濾算法使用Tensorflow構建一套電影推薦系統

現在在互聯網的時代,你會發現有很多智能的推薦系統,比如說商品的推薦,歌曲的推薦,電影的推薦。在推薦系統中,協同過濾算法是誕生最早的,也是很常用的推薦算法。有句古話:物以類聚,人以羣分。推薦算法的思想就是找到和你相似的人,也就是口味相同的人

原创 決策樹---CART算法的理解

前面兩篇博文我們介紹了一下決策樹的ID3和C4.5算法,現在我們一起來看看CART算法吧,CART是英文Classification And Regression Tree的縮寫,也就是分類迴歸樹,顧名思義,CART可以用作分類也可以用作

原创 TextRank的算法的理解

在此之前,我有寫過一篇文章博文對PageRank算法的理解,這是一個網頁排名的算法,其實TextRank算法和網頁排名算法有着很相似的地方,並且文本排名算法也來源於網頁排名算法。文本排名算法和其他算法有着一個很明顯的區別就是其他的算法的關

原创 對語言模型N-gram的理解

今天我們一起來學習一下語言模型N-gram,首先我們來用數學的方法來描述一下語言的規律,這個數學模型就是我們在自然語言處理中的統計語言模型(Statistical Language Model)。在自然語言處理中,所謂的一個句子是否合理通

原创 決策樹---ID3算法的理解

ID3(Iterative Dichotomiser 3)算法是由羅斯昆(J. Ross Quinlan)於1975年在悉尼大學提出的一種分類預測算法,算法的核心是“信息熵”(information entropy)。這個算法是通過計算出

原创 決策樹---C4.5算法的理解

在上一篇博文中,我們一起學習了決策樹中的ID3算法,知道了如何選擇決策樹分裂的屬性。但是我們細心一想,在ID3算法中仍然有幾方面的不足: 1. 在ID3算法當中,選擇分裂的屬性的時候,依據是信息增益,其實信息增益用作分裂的依據並不如信

原创 XGBoost 分類模型的Python實現

今天我們一起來學習一下如何用Python來實現XGBoost分類,這個是一個監督學習的過程,首先我們需要導入兩個Python庫: import xgboost as xgb from sklearn.metrics import accu

原创 Logistic Regression的數學推導過程以及Python實現

Logistic Regression稱爲邏輯迴歸,簡稱LR,是機器學習中一個很基礎的模型,是一種廣義的線性迴歸模型,關於Logistic Regression的知識在這裏就不再累述,我們一起來吧Logistic Regression進行

原创 TensorFlow做圖片的預處理

今天我們來一起學習一下如何用TensorFlow來處理圖片,其實這個也很簡單,主要就是做圖片旋轉,亮度色彩對比度的調整,還有就是裁剪等一系列處理。首先我們導入要用的Python庫: import tensorflow as tf impo

原创 naive bayes 算法的Python實現與理解

在機器學習中,樸素貝葉斯算法對於大家來說其實並不陌生,在我前面的博客中,我也對樸素貝葉斯算法的原理有所介紹,這篇文章我們一起來學習如何用Python來實現這個樸素貝葉斯算法。 首先我們導入numpy這個Python庫,來支持我們後續的一

原创 語義解析Parser用戶手冊

導論 Phoenix parser是爲簡單健壯的自然語言接口應用程序,特別是口語應用的開發設計的解析器。因爲自然語言經常是有語病的並且識別器也會有識別錯誤,所以parser具有魯棒性在識別、語法和流暢性中修正錯誤是很有必要的。這類pars

原创 對PageRank算法的理解

顧名思義,PageRank其實就是網頁排名的意思,當我們現在在一個搜索引擎搜索一個關鍵詞的時候,搜索引擎如何將我們最想得到的信息放在前面呢,這裏就涉及到了網頁的排名,在我們日常的搜索中,除了商業上的競價排名,總的來說,一個特定的網頁搜索取

原创 愛情中的決策樹和貝葉斯

昨天看到一篇文章情人的加分扣分,請遵守貝氏定理,看完覺得寫得真心不錯,就和同事聊起來了,說現在找男朋友都可以畫決策樹了,於是我隨意發了一張找男朋友的決策樹給同事: 於是我說:“現在找女朋友真的很扎心啊,年齡大於30歲的話,機會都沒有了。