原创 多元數據分佈——以及在MATLAB中的相關函數(《多元數據分析2012》筆記(2))

對應單變量數據分佈的二項分佈、正態分佈、beta分佈,多元數據有多項式分佈、dirichlet分佈。 1.多元正態分佈的相關函數: 隨機產生多元正態分佈的矩陣:mvnrnd; 計算多元正態概率密度函數:mvnpdf; 計算多元正態分佈的累

原创 多元數據降維方法--線性方法--《多元數據分析(2012)》筆記3

線性方法:多元特徵選擇和多元特徵轉換方法(又可分爲主成分分析和因子分析)1.主成分分析法適用於:原始數據之間存在較高的相關性,變量之間相關性越強,則原始數據之間存在非常大的冗餘。主成分分析在MATLAB中實現:princomp(需提供原始

原创 MATLAB的slice函數--書《多元數據分析2012》筆記(1)

應用: 畫變量剖面圖,不同量綱的對象不具有可比性~ 示例: *附:x(:)是把矩陣一行顯示出來 應用場景:      待補充。。。

原创 【python】案例實戰:使用sklearn構造決策樹模型

import matplotlib.pyplot as plt import pandas as pd from sklearn.datasets.california_housing import fetch_california_

原创 多元數據分析降維方法--非線性方法(多位標度分析)--(《多元數據分析(2012)》筆記)

概念: 具體地說,多維標度法是以多紹研究對象之間某種親近關係爲依據(如距離、相似係數,親疏程度的分類情況等),合理地將研究對象(樣品或變量)在低維空間中給出標度或位置,以便全面而又直觀地再現原始各研究對象之間的關係,同時在此基礎上也可按對

原创 用python進行數據分析——第七章:數據規整化、清洗、轉化、合併、重塑【3】:數據轉換

數據轉換 移除重複數據 duplicated、drop_duplicates、 利用函數和映射進行數據轉換 map 替換值 replace 重命名軸索引 .index.map rename—— data.rename(index={'OH

原创 vissim交通仿真實驗(2)--十字信號交叉口

1.導入底圖並設置比例尺: 1.1 view-background-edit,選擇JPG,再點擊顯示整個地圖按鈕。再打開這個對話框,在圖上選擇4個車道,然後將其寬度設爲14米即可。 1.2保存: 保存工程文件,保存在剛剛的文件夾下;保存底

原创 數據挖掘導論筆記1——第二章:數據

魯棒算法--有噪聲也可以產生可接受的結果。使用【特徵、變量】替代【屬性】。數據預處理1.特徵子集選擇2.特徵提取:由原始數據創建新的特徵集。3.將特徵映射到新空間4.特徵構造:由一個或者多個原始特徵構造新的特徵。5.二元化6.非監督離散化

原创 數據挖掘導論筆記2--第3章:探索數據

名詞解釋:1.多元彙總統計(協方差矩陣、相關性矩陣):2.百分位數圖、經驗累積分佈圖3.平行座標系爲了避免線交叉太多,圖形變得模糊不清,要將交叉多的那個屬性放在最左邊。4.維歸約、轉軸5.上卷和下鑽與聚集的區別

原创 Python網絡數據採集--第二章

from urllib.request import urlopen from bs4 import BeautifulSoup ##2.1 #我們可以抓出整個頁面,然後創建一個BeautifulSoup 對象 html = urlop

原创 NIK插件-托馬斯教程1-color efex pro 4

0.define2:在camera raw中顏色降噪默認,在define2裏全局降噪就不用顏色降噪了,但是局部降噪可選顏色和控制點。 1.輸入輸出銳化:一般在camera裏習慣性銳化25%,所以不用輸入銳化插件;操作過程中用out銳化插件

原创 【python】book爬蟲、數據清洗與可視化實戰2

import requests import time import pandas as pd # 加載pymongo庫i import pymongo #建立連接 client = pymongo.MongoClient('loca

原创 【arcgis】1.空間數據採集

1.添加底圖:文件-添加數據-添加底圖 2.縮放至合適大小 3.鏈接文件夾,創建文件:在文件夾上右鍵新建-shapefile 4.確定參考系:投影座標系-UTM-WGS1984-northern...-WGS84 UTM ZONE50N

原创 數據挖掘課堂筆記1

什麼是數據挖掘? 數據挖掘任務:預測+描述性的 圖: 監督對應預測性的;描述性的對應非監督 分類--預測;聚類--描述;關聯規則--描述;序列模式發現--跟關聯規則很像--描述;迴歸--預測;奇異值檢測--描述,預測。 分類: 預測,所以

原创 KNN分類原理

原文鏈接:https://zhuanlan.zhihu.com/p/22345658 kNN 可以用來進行分類或者回歸,大致方法基本相同,本篇文章將主要介紹使用 kNN 進行分類。   K:鄰居數量 1.距離函數: 最常用L2距離,即歐氏