原创 機器學習筆記一:K鄰近算法心得!

一、kNN算法概述        K最近鄰(k-Nearest Neighbor,KNN)分類算法。它主要測量不同特徵值之間的距離方法進行分類。思想很簡單:如果一個樣本在特徵空間中的k個最相似(即特徵空間中最鄰近)的樣本中的大多數屬於某一

原创 《PPT思維》第一課:PPT基礎思維

1、使論點更有力量 當我們在做一個PPT的時候,要有一個基本的PPT思維認識,那就是”使論點更有力量“。 論點:也就是內容,使得內容有邏輯、有重點 有力量:也就是表現的方式,需要圖文並茂、簡單明瞭 總的來說: PPT是點的藝術

原创 機器學習算法與Python實踐之(五)k均值聚類(k-means)

一、k-means算法        通常,人們根據樣本間的某種距離或者相似性來定義聚類,即把相似的(或距離近的)樣本聚爲同一類,而把不相似的(或距離遠的)樣本歸在其他類。        我們以一個二維的例子來說明下聚類的目的。如下圖左所

原创 如何做好一個數據分析師?

進入職場已經5年了,經歷了3家公司,從一個啥也不懂的職場菜鳥到總算知道和了解了什麼是數據分析,怎麼樣去做一個數據分析師,同時發現這纔是我的興趣,覺得這是最重要的。 首先,需要對數據感興趣,瞭解統計學,然後對生活中任何涉及統計說明的數據和事

原创 kNN鄰近算法邏輯思路和可分析示例思考?

KNN鄰近算法原理: 1、KNN主要是通過已知分類,然後通過未知的數據與其進行距離測算,然後通過給定的距離範圍裏面包含的數據量K,進行排序,數據距離最近的K個數裏面,類型數目最多的就是校驗的樣本的類型。 2、然後通過使用所有列的最大數據減

原创 Sklearn機器學習

機器學習數據挖掘 1、數據預處理 基礎查看信息 1. 數據讀取:pandas.read_excel/read_table/read_csv 2. 查看數據源基本情況:pandas:data.describe() 3. 查看數據

原创 大數據處技術二

Hadoop Hadoop有兩個核心模塊,分佈式存儲模塊HDFS和分佈式計算模塊Mapreduce Hadoop由HDFS、MapReduce、HBase、Hive和ZooKeeper等成員組成,其中最基礎最重要元素爲底層用於存儲集羣中所

原创 K-鄰近算法

導入的包 coding=UTF8 from numpy import * import operator from os import listdir import matplotlib import matplotlib.pyplot

原创 大數據分析方法論

大數據分析案列 2017年09月01日 20:04:08 480 1、體育賽事預測 世界盃期間,谷歌、百度、微軟和高盛等公司都推出了比賽結果預測平臺。百度預測結果最爲亮眼,預測全程64場比賽,準確率爲67%,進入淘汰賽後準確率爲94%

原创 集羣定義

大數據核心技術 集羣: 集羣是一組相互獨立的、通過高速網絡互聯的計算機,它們構成了一個組,並以單一系統的模式加以管理。一個客戶與集羣相互作用時,集羣像是一個獨立的服務器。集羣配置是用於提高可用性和可縮放性。 和傳統的高性能計算機技術

原创 網站訪問時長和訪問深度指標分析

網站指標 訪問時長Length of Visit和訪問深度Depth of Visit在Google Analytics中是兩個不太起眼的度量(與其他度量相比),但它讓我們從不同的角度來洞察網站的停留時間和綜合瀏覽量在每次訪問中的分佈。避

原创 Python可視化筆記三

Numpy和Scipy、pandas定義: 1、Numpy是以矩陣爲基礎的數學計算模塊,純數學; 2、Scipy基於Numpy,科學計算庫,有一些高階抽象和物理模型。比方說做個傅立葉變換,這是純數學的,用Numpy;做個濾波器,這屬於信

原创 機器學習實戰

機器學習十大算法 KNN算法 算法原理 k-近鄰算法採用測量不同特徵值之間的距離方法進行分類。 距離公式:歐氏距離 僞代碼 計算已知類別數據集中的點與當前點之間的距離; 按照距離遞增次序排序; 選取與當前點距離最小的k個點; 確定前k

原创 機器學習實戰:K-近鄰算法(KNN)

KNN K-近鄰算法原理 歐幾里得距離公式: 僞代碼原理 計算已知類別數據集中的點與當前點之間的距離 按照距離遞增次序排序 選取與當前點距離最小的K個點 確定前K個點所在類別的出現頻率 返回前K個點出現頻率最高的類別作爲當前點的預測分類

原创 Python可視化學習筆記二

一、定義圖表類型-柱狀圖、線形圖和堆積柱狀圖 # -*- coding: UTF-8 -*- from matplotlib.pyplot import * import matplotlib.pyplot as plt def fo