原创 聚類有效性——最佳聚類數

聚類有效性的評價標準有兩種:一是外部標準,通過測量聚類結果和參考標準的一致性來評價聚類結果的優良;另一種是內部指標,用於評價同一聚類算法在不同聚類數條件下聚類結果的優良程度,通常用來確定數據集的最佳聚類數。 一 最佳聚類數判定的

原创 午間閱讀

1   個性化推薦的十大挑戰 http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=209167484&idx=1&sn=700d61576151ac39ed8473b3e8c14476

原创 目標檢測——背景更新法

在運動目標檢測中,爲了完善當前構建的背景模型,更好的策略就是更新背景模型。 如果model是當前背景模型,cur是當前幀,則新的模型爲: modelnew = (1-a)*model+a*cur (a爲學習率),隨着時間的推移

原创 檢測出運動目標後提取邊界 兩個函數 cvFindContours和cvBoundingRect

      1   cvFindContours( void*  img,  CvMemStorage*  storage,            

原创 相關分析與迴歸分析(一)

相關分析和迴歸分析都是研究變量間相互關係,測定它們聯繫的緊密程度、揭示其變化的具體形式和規律性的統計方法。 1、  涵義 (1)      相關分析是對具有相關關係的變量之間的關係密切程度進行分析研究的統計方法; (2)      迴歸分

原创 Latex安裝與公式編輯小結

這兩天開始用Latex,遇到了很多問題。這裏做一個總結,在後續的使用中可繼續補充。 一 安裝  1.出於自動化學報的要求,版本選擇CTex v2.4.6 ftp://ftp.ctex.org/pub/tex/systems/ctex/ob

原创 數據預處理(方法介紹)

常見的數據預處理方法有:數據清洗、數據集成、數據變換和數據歸約。 1.      數據清洗:數據清洗的目的不只是要消除錯誤、冗餘和數據噪音,還要能將按不同的、不兼容的規則所得的各種數據集一致起來。 2.      數據集成:將多個數據源中

原创 基於R做相關分析

R 中,cor.test ()提供了三種檢驗方法:Pearson相關性檢驗(R默認);Spearman秩檢驗;Kendall檢驗。調用格式爲: cor.test ( x, y, alternative=c("two.side" ,  "l

原创 聚類算法分析——Kmeans算法

Kmeans算法的基本思想是初始隨機給定K個簇中心,按照最鄰近原則把待分類樣本點分到各個簇。然後通過計算各個簇中數據點的平均值,更新簇中心,迭代至滿足收斂條件。 Kmeans的目標函數:(這裏以歐式距離作爲衡量近鄰標準進行分析)

原创 流形學習應用與展望

 一  流形學習典型應用  1 可視化 人不能直觀感知高維度的數據集的內部結構,但對三維以下的數據集的內在規律有着很強的感知能力。流形學習可以將高維數據的內在關係在低於三維的空間中展示出來,使得人們能夠直觀地認識高維數據的內在規律,並瞭解

原创 高斯混合模型(matlab代碼+註釋)

這裏我學習的是Statistical Patte7rn Recognition Toolbox中的emgmm代碼,代碼中的主要知識點在之前的GMM文檔中基本解釋清楚,包括EM算法中的兩個步驟。我自己先看原理,再去看代碼,在給代碼註釋的過程

原创 譯文《What everybody ought to know about a Data Scientist 》

原文地址:http://bigdata-madesimple.com/what-everybody-ought-to-know-about-data-scientist/ 原文很好理解,我備註了中文翻譯在下面,如果翻譯不妥之處,望指正。

原创 半監督學習研究

昨天閱讀了半監督學習的一些綜述,整理如下: 在機器學習的實際應用中,如網頁分類、文本分類、基因序列對比、蛋白質功能預測、語音識別、自然語言處理、計算機視覺和基因生物學,很容易找到海量的無類標籤的樣例,但需要使用特殊設備或經過昂貴且用時非

原创 基於R統計分析——樣本與分佈

1 數據抽樣 (1) 簡單隨機抽樣 sample(x,size,replace=FALSE,prob=NULL) 其中,x表示待抽取對象,一般情況下以向量形式表示;size爲非負整數,表示想要抽取樣本的個數;replace表示是否爲可放

原创 機器學習之迴歸分析——Logistic regression

傍晚把李航老師的《統計學習方法》拿出來重新翻閱了一遍,覺得之前看的太不仔細了,現在慢慢整理,從算法原理到實現過程。今天主要看了Logistic regression,之後補上代碼和求解目標函數常用的梯度下降法、擬牛頓法。