原创 機器學習之sklearn筆記:廣義線性模型

廣義線性模型原理 公式:Y=w0+w1*x1+… …+wnxn 普通最小二乘法 原理: 公式: 原理 示例代碼 import matplotlib.pyplot as plt import numpy as np from sklea

原创 機器學習算法應用場景

  本文整理了60個機器學習算法應用場景實例,含分類算法應用場景20個、迴歸算法應用場景20個、聚類算法應用場景10個以及關聯規則應用場景10個。包含了天池、DataCastle、DataFountain中所有競賽場景。 目錄

原创 Python可視化學習筆記一

from matplotlib.pyplot import * import matplotlib.pyplot as plt def learn_1(): #plot儲存數據集,多組數據展現多條線 ”’

原创 機器學習算法原理和思路

機器學習算法 有監督學習:分類和預測 1、KNN算法:通過計算未知數據和樣本距離中,數目最多類判斷未知類歸屬。 2、決策樹算法:通過信息增益來劃分類,然後逐級劃分到葉子節點。 3、貝葉斯算法:通過判斷文本拆分後和樣本比較出現的概率來確

原创 數據挖掘十大經典算法原理

數據挖掘十大經典算法 一、 C4.5 C4.5算法是機器學習算法中的一種分類決策樹算法,其核心算法是ID3 算法. C4.5算法繼承了ID3算法的優點,並在以下幾方面對ID3算法進行了改進: 1) 用信息增益率來選擇屬性,克服了用

原创 機器學習十大算法原理總結

監督學習算法: 1、K-近鄰算法:通過建立和樣本之間的距離求和,然後通過選擇最近的K個樣本數據,樣本數據類型多的就是需要分的類型。 2、決策樹算法:通過求最大信息增益來得到需要判斷和拆分的標籤類目,然後建立遞歸數,進行繼續拆分到葉子節

原创 機器學習實戰:降維方法

降維方法 主成分分析(Principal Component Analysis,PCA) 因子分析(Factor Analysis) 獨立成分分析(Independent Component Analysis,ICA) 主成分分析:P

原创 機器學習算法與Python實踐之(五)k均值聚類(k-means)原理補充

Mean-shift 1)概述 Mean-shift(即:均值遷移)的基本思想:在數據集中選定一個點,然後以這個點爲圓心,r爲半徑,畫一個圓(二維下是圓),求出這個點到所有點的向量的平均值,而圓心與向量均值的和爲新的圓心,然後迭

原创 Python生成PDF文件(1)

如何將文檔轉變爲 PDF 文件舉例 ReportLab 爲了方便生成文檔提供了一種叫PLATYPUS(Page Layout and Typography Using Scripts)的一系列的模板類,它用於控制文檔的佈局,可以讓我們不用