原创 python-算法與數據結構-DAY_6

1.快速排序 快速排序要理解遞歸在中間的作用 基本原理 1.首先選出一個值作爲中間值,將中間值放旁邊,在頭尾分別放置兩個遊標 2.頭尾遊標通過夾逼,得到中間值所在位置,以次爲基準,一分爲二,這時左側爲小於中間值的數組,右側爲大於中

原创 python_matplotlib DAY_22(1)註釋,圖例,填充

學習內容 matplotlib的註釋操作 重點 1.註釋plt.annotate import numpy as np import matplotlib.pyplot as plt a = np.arange(-10, 10,

原创 SKlearn計算機生成數據集API

計算機生成數據集 sklearn.datasets.make_ 1.用於分類和聚類的數據集 make_blobs:多類單標籤數據 make_classification: make_gaussian_quantiles: make

原创 sklearn--分類器評估指標綜述

sklearn.metric中性能的度量函數大體有四種 分類器性能指標 迴歸其性能指標 聚類器性能指標 兩兩距離測度 1.分類器性能指標 分類器的性能指標有很多,最常用的是三種 精度-召回率-F度量(precision-recal

原创 sklearn轉換器與預估器

1.轉換器 實例化是一個轉換器類(transformer) 調用fit_transform(對於建立詞頻矩陣,不能同時調用) 可以將數據集變爲可用的數據集,是一種直接轉換的形式。 fit()是輸入數據,但是不進行轉換。 trans

原创 小波變換------多尺度空間能量分佈特徵提取方法

用小波技術可以把信號在各頻率波段中的特徵提取出來,基於小波變換的多尺度空間能量分佈特徵提取方法是對信號進行頻段分析,再分別以計算所得的各個頻帶的能量作爲特徵向量: 信號f(t)的二進小波分解可表示爲:

原创 GAN-DAY_1

初識生成對抗網絡 1. GAN 的組成以及運行過程 GAN由兩部分組成,一個是生成器(generator),一個是鑑別器(discriminator) 生成器的作用主要用於生成數據,我們輸入一個N維向量,生成器可以生成對應所需的

原创 sklearn分類器評估指標(精確率,混淆矩陣,precious-recall-Fmeasur,ROC曲線,損失函數)

1.精確率 accuracy_score函數計算分類準確率:返回被正確分類的樣本比例或者數量 當多標籤分類任務中,該函數返回子集的準確率,對於給定的樣本,如果預測得到的標籤集合與該樣本真正的標籤集合吻合,那麼subset accu

原创 sklearn迴歸器評估方法

1.解釋方差 可用於多目標參數 sklearn.metrics.explained_variance_score() from sklearn.metrics import explained_variance_score

原创 sklearn模型選擇--數據集的劃分

數據集的劃分 sklearn.model_selection.<name>#調用數據劃分的指令 1.交叉驗證 kFold,GroupFold,StratifiedFold 劃分的策略如下 1.將數據集S劃分成K個不相交的子集 2.

原创 sklearn模型選擇--超參數優化

超參數是指我們無法直接從數據集獲取的參數。 超參數的選擇是通過搜索超參數的取值空間來選擇的,我們可以使用estimator.get_params()來獲取當前的參數,但是一般不會一步一步靠獲取當前參數來選擇最優結果。所以我們經常用

原创 sklearn----數據集操作

數據集存放在sklearn下的datasets中 導入格式如下 sklearn.datasets.load_<name>#導入數據的代碼 1.鳶尾花數據 from sklearn.datasets import load_iris

原创 sklearn模型選擇--模型評估方法

模型評估方法 1.Estimator對象的score方法 score會調用predict函數,獲取預測相應,然後與傳入的真實值對比,計算得分 分類器繼承了classifiermixin的類, 判別標準sklearn.metrics

原创 python-數據結構和算法-DAY_7

1.決策樹(重點討論二叉樹) 以上圖爲例 廣度遍歷:013456789 深度遍歷: 1.先序遍歷,根左右:0137849256 2.中序遍歷,左根右:7381940526 3.後序遍歷,左右根:7839415620 class

原创 python-數據結構與算法-DAY_5-常見排序的代碼實現

1.冒泡排序 作爲常見的排序方法之一,冒泡排序的原理很簡單 1.從一組數據的下標索引爲0開始,每次與下一位數據做對比,如果比下一位數據要大,則交換兩數據的位置,將所有元素按順序重複這個過程,就實現了一次循環。 2.一次循環後會將最