原创 常用表達式的矩陣表示

X=(x1,x2,...,xm)∈Rd×m ,Y=(y1,y2,...,yl)∈Rd×l ,l≤m . xi↔yi ,i=1,…,l . I 爲l×l 單位矩陣。 已知對應點信息的保持: ∑li=1(xi−yi)2=tr((XY

原创 PCA和核PCA

PCA 當處理高維數據時,需要面臨降維,進行特徵抽取,PCA是特徵抽取的主要方法之一,特徵抽取即利用映射的方法,將高維度的樣本映射至低維度。PCA適用於非監督的不帶標籤的樣本降維,特別是小樣本問題。廣義認爲,這類樣本屬性之間的相關

原创 MVU

MVU MVU算法核心思想 在局部等距約束條件下通過最大化非近鄰點間的距離,在低維空間中展開高維數據。 數據集的局部等距要求每個數據點和它的近鄰點在平移、旋轉等作用下它們之間的角度和距離保持不變。 設原樣本X=[x1,x2,⋯

原创 eig 與eigs

eig 一般用來解決小規模的矩陣,如果矩陣比較稀疏或奇異,會出現“EIG did not converge.”的錯誤,例如我在求下面一個1200*1200的稀疏矩陣M時就出現了下面的錯誤 [v1,c1] = eig(M1);

原创 FDA降維

FDA是一個傳統的有用的線性有監督的降維方法,FDA通過最大化類間距離,最小化類內距離的方法降維,但是對於呈現多峯的樣本數據的降維效果並不好。爲了對多峯數據降維,首要的是要保持數據的局部結構。LPP通過保持數據的局部結構獲得很好的

原创 ubuntu 安裝scipy

在虛擬機的ubuntu系統中安裝scipy時, 用命令”sudo apt-get install scipy” 報錯“E:無法定位軟件包” 用“sudo apt-get update”更新軟件庫, 再執行”sudo apt-

原创 TensorFlow tf.nn.conv2d

在MNIST例程的卷積模型中,最關鍵的就是tf.nn.conv2d和tf.nn.max_pool兩個函數, 先把引用這兩個函數的代碼片貼出來: def conv2d(x, W, b, strides=1): # Conv

原创 win10安裝Ipython

最近在學習tensorflow時,研究別人的代碼時說是要import Ipython包,雖然還不知道這個包是幹什麼的,還是在網上搜了各方教程,先安裝上再說吧,看它到底長什麼樣。 一、下載ez_setup.py 這裏可以自動下載,

原创 一些預處理方法的鏈接

MFCC特徵提取詳解:http://my.oschina.net/jamesju/blog/193343 文本處理:http://ju.outofmemory.cn/entry/103693 可以下載TDT2, Reuters21

原创 堅持積累,堅持分享

最近在學習計算機方面的內容,想成功轉型到計算機,對於這段時間比較焦急,希望能在有限的時間儘量多的學習一些對未來有幫助的東西,感覺自己基礎比較薄弱,有

原创 win10安裝numpy,matplot,scipy

環境:win10, 64bit, Python2.7 一、設置系統環境變量 依次點擊:此電腦–>屬性–>高級系統設置–>環境變量 出先下面的選項卡,在下面的選項卡中的“系統變量”中選擇“path”,然後點 ”編輯“

原创 python實現KNN解析

KNN分類算法(K-Nearest-Neighbors Classification),又叫K近鄰算法,是一個概念極其簡單,而分類效果又很優秀的分類算法。 他的核心思想就是,要確定測試樣本屬於哪一類,就尋找所有訓練樣本中與該測試樣

原创 一些有用的數據集的鏈接

人臉識別數據集 http://www.face-rec.org/databases/

原创 caffe用自己的數據訓練模型,並測試輸出圖片類別

一、製作自己的數據集 首先將所有圖片放在一個文件夾中,文件夾中根據類別建幾個子文件夾,每個子文件夾放某一類所有圖片,並根據類別編號。 如我這裏是要對stanfdog數據集進行分類,該數據集總共有20580張狗狗的圖片,分成120類,每

原创 PIL 中image

以前在matlab中,讀入圖像,輸出圖像size是(高度,寬度,通道) 在python中,讀入圖像,輸出圖像size是(寬度,高度) 例如這幅圖 是一張寬度爲240,高度爲100的rgb圖像,命名爲code.jpg 在matla