原创 SPSS典型相關分析(Canonical Correlation Analysis)案例(SPSS25最新版)

一、爲什麼要用典型相關分析 典型相關分析研究的是兩組變量之間的關係,如{x1, x2, x3}和{y1, y2, y3}兩組變量之間的關係。 具體來說,變量間的相關關係可以分爲以下幾種: 兩個變量間的線性相關關係,可用簡單相關係

原创 機器學習 Cohen s Kappa,Quadratic Weighted Kappa 詳解

首先需要明確,Kappa係數既可用於統計中的一致性檢驗,也可以用於機器學習中來衡量分類精度。它們的本質是一樣的,但是理解方式略有不同,本文將從機器學習的角度來闡述Kappa係數。 一、基本思想 一般來說,對於機器學習中的分類問題,

原创 【長文乾貨】MySQL必知必會——增刪改查知識總結

1.準備工作 1.1使用wampserver安裝本地服務器 1.2安裝Navicat(交互式的mysql控制軟件): Navicat for mysql破解 1.3下載本文所需數據庫文件 MySQL Crash Course 1.4登

原创 使用pandas選擇和索引數據方法大全,附思維導圖

使用pandas索引和選擇數據時,總是需要百度,因此決定對pandas.DataFrame中的索引和選擇方法做個總結。 pandas中有三種主要索引方法: [] :基本切片方法 .loc :基於標籤 .iloc :基於位置 注意:.

原创 Pycharm如何關閉 代碼補全 / 代碼提示 功能

Pycharm是一款非常好用的Python的IDE。但就是因爲它太好用了,所以對於Python新手來說,反而會導致脫離了代碼提示功能,就完全不記得了函數名,大小寫等,這對於新手來說是不太利於成長的。 但是有一說一,Pycharm本身還

原创 解決Pycharm和pip都安裝TensorFlow失敗的問題(Windows 10)

pip報錯:Could not find a version that satisfies the requirement tensorflow (from versions: ) No matching distribution f

原创 【Python機器學習實戰】一個案例迅速入門所有的Scikit-learn迴歸模型

簡介 本文旨在通過經典的波士頓放假預測問題來實戰運行一下sk-learn中所有常見的迴歸算法,因此不涉及過多的算法講解。下面,先對本文中會用到的算法進行簡單的介紹: 線性迴歸器: 線性迴歸器是最簡單、易用的迴歸模型。由於預測目標直接

原创 【Python機器學習實戰】無監督學習之PCA和K-Means二連擊

簡介 無監督學習着重於發現數據本身的分佈特點。與監督學習不同,無監督學習不需要對數據進行標記。 從功能上來看,無監督學習模型可以用於發現數據的“羣落”(聚類),同時也可以尋找“離羣”的樣本,另外,對於特徵維度非常高的數據樣本,我們同樣

原创 sklearn機器學習實例 - 決策樹和集成分類模型入門與實戰

決策樹簡介 決策樹(decision tree)是一類常見的機器學習方法,目的是爲了產生一棵泛化能力強,即處理未見示例能力強的決策樹。 本文目的在於快速通過sklearn實踐算法而獲得直觀感受,因此對於算法的原理不做過多深入介紹,感興

原创 sklearn實例-用支持向量機分類器(SVC)識別手寫字體

簡介 支持向量機(Support Vector Machine)作爲機器學習中最常用的算法之一,有着非常強大的性能。 SVM既可以用來分類,即SVC(Support Vector Classifier);也可以用來預測(迴歸),那就是

原创 機器學習必備,用matplotlib畫2D和3D散點圖參數介紹及實例分析

一、簡介 在機器學習中,經常需要通過散點圖查看原始數據的分佈情況,從而對特徵和算法的選擇進行初步判斷。 散點圖可以形象展示直角座標系中兩個變量之間的關係。在散點圖中 ,每個數據點的位置實際上就是兩個變量的值。變量間的任何關係都可以拿散

原创 基於SPSS25的典型相關分析(Canonical Correlation Analysis)案例

一、爲什麼要用典型相關分析 典型相關分析研究的是兩組變量之間的關係,如{x1, x2, x3}和{y1, y2, y3}兩組變量之間的關係。 具體來說,變量間的相關關係可以分爲以下幾種: 兩個變量間的線性相關關係,可用簡單相關係數

原创 sklearn實例-邏輯迴歸(Logisitic Regression)和隨機梯度下降(SGDClassifier)全流程

簡介 線性分類器可以說是最爲基本和常用的機器學習模型。儘管其受限於數據特徵與分類目標的線性假設,我們仍然可以在科學研究與工程實踐中把線性分類器的表現作爲基準。 本文使用的模型包括LogisticRegression和SGDClassi

原创 sk-learn實例-用樸素貝葉斯算法(Naive Bayes)對文本進行分類

簡介 樸素貝葉斯(Naive Bayes)是一個非常簡單,但是實用性很強的分類模型,與基於線性假設的模型(線性分類器和支持向量機分類器)不同,樸素貝葉斯分類器的構造基礎是貝葉斯理論。 抽象一些的說,樸素貝葉斯分類器會單獨考量每一維度特

原创 【Python數據分析基礎】Numpy常用的基礎知識總結

本文基於*Python數據分析實戰( by Fabio Nelli),Python數據分析(by Armando Fandango)*兩本書中內容及個人經驗總結,歡迎一起討論數據分析和機器學習哇~ 1.NumPy基本概念: ①Nu