原创 多元數據分佈——以及在MATLAB中的相關函數(《多元數據分析2012》筆記(2))
對應單變量數據分佈的二項分佈、正態分佈、beta分佈,多元數據有多項式分佈、dirichlet分佈。 1.多元正態分佈的相關函數: 隨機產生多元正態分佈的矩陣:mvnrnd; 計算多元正態概率密度函數:mvnpdf; 計算多元正態分佈的累
原创 多元數據降維方法--線性方法--《多元數據分析(2012)》筆記3
線性方法:多元特徵選擇和多元特徵轉換方法(又可分爲主成分分析和因子分析)1.主成分分析法適用於:原始數據之間存在較高的相關性,變量之間相關性越強,則原始數據之間存在非常大的冗餘。主成分分析在MATLAB中實現:princomp(需提供原始
原创 MATLAB的slice函數--書《多元數據分析2012》筆記(1)
應用: 畫變量剖面圖,不同量綱的對象不具有可比性~ 示例: *附:x(:)是把矩陣一行顯示出來 應用場景: 待補充。。。
原创 【python】案例實戰:使用sklearn構造決策樹模型
import matplotlib.pyplot as plt import pandas as pd from sklearn.datasets.california_housing import fetch_california_
原创 多元數據分析降維方法--非線性方法(多位標度分析)--(《多元數據分析(2012)》筆記)
概念: 具體地說,多維標度法是以多紹研究對象之間某種親近關係爲依據(如距離、相似係數,親疏程度的分類情況等),合理地將研究對象(樣品或變量)在低維空間中給出標度或位置,以便全面而又直觀地再現原始各研究對象之間的關係,同時在此基礎上也可按對
原创 用python進行數據分析——第七章:數據規整化、清洗、轉化、合併、重塑【3】:數據轉換
數據轉換 移除重複數據 duplicated、drop_duplicates、 利用函數和映射進行數據轉換 map 替換值 replace 重命名軸索引 .index.map rename—— data.rename(index={'OH
原创 vissim交通仿真實驗(2)--十字信號交叉口
1.導入底圖並設置比例尺: 1.1 view-background-edit,選擇JPG,再點擊顯示整個地圖按鈕。再打開這個對話框,在圖上選擇4個車道,然後將其寬度設爲14米即可。 1.2保存: 保存工程文件,保存在剛剛的文件夾下;保存底
原创 數據挖掘導論筆記1——第二章:數據
魯棒算法--有噪聲也可以產生可接受的結果。使用【特徵、變量】替代【屬性】。數據預處理1.特徵子集選擇2.特徵提取:由原始數據創建新的特徵集。3.將特徵映射到新空間4.特徵構造:由一個或者多個原始特徵構造新的特徵。5.二元化6.非監督離散化
原创 數據挖掘導論筆記2--第3章:探索數據
名詞解釋:1.多元彙總統計(協方差矩陣、相關性矩陣):2.百分位數圖、經驗累積分佈圖3.平行座標系爲了避免線交叉太多,圖形變得模糊不清,要將交叉多的那個屬性放在最左邊。4.維歸約、轉軸5.上卷和下鑽與聚集的區別
原创 Python網絡數據採集--第二章
from urllib.request import urlopen from bs4 import BeautifulSoup ##2.1 #我們可以抓出整個頁面,然後創建一個BeautifulSoup 對象 html = urlop
原创 NIK插件-托馬斯教程1-color efex pro 4
0.define2:在camera raw中顏色降噪默認,在define2裏全局降噪就不用顏色降噪了,但是局部降噪可選顏色和控制點。 1.輸入輸出銳化:一般在camera裏習慣性銳化25%,所以不用輸入銳化插件;操作過程中用out銳化插件
原创 【python】book爬蟲、數據清洗與可視化實戰2
import requests import time import pandas as pd # 加載pymongo庫i import pymongo #建立連接 client = pymongo.MongoClient('loca
原创 【arcgis】1.空間數據採集
1.添加底圖:文件-添加數據-添加底圖 2.縮放至合適大小 3.鏈接文件夾,創建文件:在文件夾上右鍵新建-shapefile 4.確定參考系:投影座標系-UTM-WGS1984-northern...-WGS84 UTM ZONE50N
原创 數據挖掘課堂筆記1
什麼是數據挖掘? 數據挖掘任務:預測+描述性的 圖: 監督對應預測性的;描述性的對應非監督 分類--預測;聚類--描述;關聯規則--描述;序列模式發現--跟關聯規則很像--描述;迴歸--預測;奇異值檢測--描述,預測。 分類: 預測,所以
原创 KNN分類原理
原文鏈接:https://zhuanlan.zhihu.com/p/22345658 kNN 可以用來進行分類或者回歸,大致方法基本相同,本篇文章將主要介紹使用 kNN 進行分類。 K:鄰居數量 1.距離函數: 最常用L2距離,即歐氏