原创 Python編程實現後剪枝的CART決策樹

前面實現了不進行剪枝的CART決策樹和預剪枝的決策樹,本文是對後剪枝的CART決策樹的實現,這樣關於CART決策樹的東西就湊全了。 後剪枝的策略是一種“事後諸葛亮”的策略,因而效果往往要比預剪枝和不剪枝要好。主要的操作方式就是在生成一顆不

原创 Python編程實現基於基尼指數進行劃分選擇的決策樹(CART決策樹)算法

本文是周志華老師的《機器學習》一書中第4章 決策樹 的課後題第4.4題的實現。原題是: 試編程實現基於基尼指數進行劃分選擇的決策樹算法,爲表4.2中的數據生成預剪枝、後剪枝決策樹,並與未剪枝決策樹進行比較。 與ID3算法選擇信息增益作爲

原创 Python編程實現基於信息熵進行劃分選擇的決策樹算法

本篇是周志華老師的《機器學習》第4章 決策樹 課後題4.3的實現,原題是: 試編程實現基於信息熵進行劃分選擇的決策樹算法,併爲表4.3中數據生成一顆決策樹。 這裏需要注意的是此數據集中,有的屬性是離散的,有的屬性是連續的,對於連續的屬性

原创 如有不當之處,歡迎通過QQ進行深入交流

目前CSDN取消了普通用戶的自定義欄目權限,所以現在我把自己的聯繫方式在這裏以一篇單獨的博客的方式張貼出來。 如有不當之處,歡迎通過QQ進行聯繫指出,同時也歡迎通過微信打賞對博主進行支持。  

原创 使用Pycharm將代碼同步到GitHub

GitHub是一個很方便的管理代碼版本的工具。尤其是在你需要與其他人合作編程或者是使用不同電腦進行編程的時候,使用GitHub會比較方便。下面來記錄一下如何將Pycharm中的項目同步到GitHub中。 首先在Pycharm中創建一個項目

原创 微信打賞方式

歡迎使用微信掃碼打賞,如有疑問可通過QQ進行聯繫。

原创 python中matplotlib的顏色及線條控制

本文轉自博客園,作者是darkknightzh,以下是原文 -----------------------------------------------------------------------------------------

原创 計算任意多邊形面積的Python實現

        最近需要實現一個計算非凸多邊形面積的功能,需要輸入是順次排序的多邊形頂點座標,假設輸入的多邊形頂點是V={v0, v1, v2, …, vn-1},則多邊形的邊爲E={<v0, v1>, <v1, v2>, <v2, v3

原创 從SNE到t-SNE再到LargeVis 鏈接

今天在網上看到了兩篇不錯的講解t-SNE的文章,雖然有些小錯誤,但是瑕不掩瑜,作者寫得非常認真,對於理解t-SNE方法有很大的幫助。因爲作者不允許轉載,所以這裏記錄一下這兩篇文章的鏈接以備後來查閱。這兩篇文章分別是 從SNE到t-SNE再

原创 《算法導論》第三版勘誤與建議

      最近在讀由殷建平、徐雲、王剛、劉曉光、蘇明、鄒恆明和王志宏七位老師翻譯,機械工業出版社出版的《算法導論(第3版)》這本書,發現了一些不太恰當的地方,在這裏進行一下記錄,以方便日後再讀時查閱。此處按照頁碼順序進行排序,由於我現在

原创 Graham-Scan算法計算凸包的Python代碼實現

對於一個點集P來講,它的凸包就是一個凸多邊形Q,其中滿足P中的每個點都在Q的邊界上或內部。就像下圖所示 凸包的計算算法有好多種,wiki和算法導論第33章中都有比較詳細的介紹,比如下面是算法導論中給出的Graham-Scan算法計算凸包

原创 正整數前n項平方和與立方和的推導

在中學時就學過正整數平方與立方的前n項和的公式,當時只是給出了這麼一個公式,並讓使用數學歸納法證明了一下,並沒有給出這兩個公式是怎麼來的。昨天在學算法的時候用到了這兩個公式,於是順便正向地推導出了這兩個公式。 可以首先結合幾何方面的意

原创 第七屆中國數據挖掘會議紀要

這次會議是一個數據挖掘領域的會議,因而有些東西可能與我們進行可視化相關研究並不具有那麼直接的聯繫。不過我們的可視化研究在某種程度上來說是爲數據挖掘服務的,因而增加一些對數據挖掘其他方面的瞭解還是很有意義的。 產業界高峯論壇     五號

原创 浙大暑期學校總結

    這次有幸前往杭州參加浙大舉辦的可視化暑期學校,這次杭州之行使我對一些可視化鄰域內的研究者的工作有了一定的瞭解,也對其他的一些東西有了進一步的認識。     第一個做報告是來自奧地利的Tobias教授,這個報告是對可視化研究領域的一

原创 秋日開學

少年不惜少年時 花謝人老尚不知 一朝滾落俗塵裏 再無幽篁照月時