原创 Naive Bayes with R

Datacamp Learning Naive Bayes with R Computing probabilities The where9am data frame contains 91 days (thirteen week

原创 Python學習之使用ktinker的GUI設計

Python學習之使用ktinker的GUI設計 基礎代碼 from tkinter import * import tkinter.messagebox as messagebox class Application(Frame):

原创 Logistic regression in R

Datacamp Learning Logistic regression in R Building simple logistic regression models The donors dataset contains 93

原创 樸素貝葉斯之實例

樸素貝葉斯實例 目錄 樸素貝葉斯實例 1.言論過濾器代碼 2.過濾垃圾郵件代碼 3.貝葉斯之新浪新聞分類(Sklearn)   1.言論過濾器代碼 import numpy as np from functools import red

原创 Logistic迴歸基礎篇之梯度上升算法

  Logistic迴歸基礎篇之梯度上升算法 鏈接:https://blog.csdn.net/c406495762/article/details/77723333 https://blog.csdn.net/c406495762/a

原创 《機器學習實戰》學習筆記(一):k-近鄰算法

k-近鄰算法 原書中代碼爲python2中語法,python3的語法參考鏈接:https://blog.csdn.net/c406495762/article/details/75172850 給出k-近鄰算法的完整代碼(海倫相親程序

原创 Machine Learning學習筆記(十四)集成學習(Boosting,Bagging,組合策略)

集成學習 在一些數據挖掘競賽中,後期我們需要對多個模型進行融合以提高效果時,常常會用到Bagging,Boosting,Stacking等這幾個框架算法。 集成學習在機器學習算法中具有較高的準確率,不足之處就是模型的訓練過程可能比較複雜

原创 Python學習之pandas包

Pandas包學習路線與資料 1. 10 Minutes to pandas 【已完成】 原版:http://pandas.pydata.org/pandas-docs/stable/10min.html 中文版:https://www

原创 關於熵的知識——信息論基本概念

信息論 1 信息量 首先是信息量。假設我們聽到了兩件事,分別如下:  事件A:巴西隊進入了2018世界盃決賽圈。  事件B:中國隊進入了2018世界盃決賽圈。  僅憑直覺來說,顯而易見事件B的信息量比事件A的信息量要大。究其原因,是因爲

原创 Machine Learning學習筆記(十一)優化算法的總結

優化算法 關於優化:我們每個人都會在我們的生活或者工作中遇到各種各樣的最優化問題,比如每個企業和個人都要考慮的一個問題“在一定成本下,如何使利潤最大化”等。最優化方法是一種數學方法,它是研究在給定約束之下如何尋求某些因素(的量),以使某一

原创 數學建模之層次分析法(AHP)

層次分析法(Analytic Hierarchy Process) AHP是對一些較爲複雜的,較爲模糊的問題作出決策的簡易方法,它特別適用於那些難以完全定量分析的問題。 它是美國運籌學家T.L.Saaty教授於上世紀70年代初期提出的一

原创 Machine Learning學習筆記(十)K-means聚類算法

K-Means介紹        K-means算法是聚類分析中使用最廣泛的算法之一。它把n個對象根據他們的屬性分爲k個聚類以便使得所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。其聚類過程可以用下圖表示:  

原创 Machine Learning學習筆記(十二)禁忌搜索算法(Tabu Search)

禁忌搜索算法(Tabu search) 對禁忌搜索算法TS的思想做一個歸納總結。 一、禁忌搜索算法的基礎:局部領域搜索    局部領域搜索,又稱爬山啓發式算法。從當前的節點開始,和周圍的鄰居節點的值進行比較。如果當前節點是最大的,那麼

原创 線性判別法則(LDA)

線性判別法則(Linear Discriminant Analysis) LDA是一種監督學習。也稱爲Fisher's linear discriminant。 LDA的原理是,將帶上標籤的數據(點),通過投影的方法,投影到維度更低的

原创 Machine Learning學習筆記(十三)隨機森林(RandomForest)

隨機森林(RandomForest) 一、知識鋪墊 1.1 決策樹 決策樹是機器學習最基本的模型,在不考慮其他複雜情況下,我們可以用一句話來描述決策樹:如果得分大於等於60分,那麼你及格了。(if-then語句) 這是一個最最簡單的決策樹