原创 Linux之間配置SSH互信(SSH免密碼登錄)

Linux之間配置SSH互信(SSH免密碼登錄) 爲簡化SSH過程,採用證書方式,免去SSH登入時需要輸入賬號密碼的過程,具體操作如下: 一、在SSH服務器所在機器上 1、以root用戶登錄,更改ssh配置文件 /etc/ssh/sshd

原创 關於Java中形參與實參的理解

今天閱讀了一個寫的非常棒的博文,通過此博文再次複習了Java中參數傳遞的知識(即值傳遞與引用傳遞的區別)。參考網站http://www.cnblogs.com/binyue/p/3862276.html。下面我將通過次博文記錄自己的理解,

原创 數據正規化 (data normalization) 的原理及實現 (Python sklearn)

原理 數據正規化(data normalization)是將數據的每個樣本(向量)變換爲單位範數的向量,各樣本之間是相互獨立的.其實際上,是對向量中的每個分量值除以正規化因子.常用的正規化因子有 L1, L2 和 Max.假設,對長度爲

原创 PolynomialFeatures多項式轉換

使用sklearn.preprocessing.PolynomialFeatures來進行特徵的構造。 它是使用多項式的方法來進行的,如果有a,b兩個特徵,那麼它的2次多項式爲(1,a,b,a^2,ab, b^2)。 Polynomial

原创 從 Java 代碼到 Java 堆

詳細參見:https://www.ibm.com/developerworks/cn/java/j-codetoheap/

原创 隱馬爾科夫模型學習筆記

隱馬爾科夫模型 Viviterbi算法   馬爾科夫性質 馬爾科夫鏈 馬爾科夫鏈案例 HMM HMM(Hidden Markov Model)隱馬爾科夫模型是一種統計模型,在語音識別、行爲識別、NLP、故障診斷等領域具有高效的性

原创 SVM學習筆記(一)

梯度下降法、拉格朗日乘子法、KKT條件回顧 感知器模型回顧 SVM線性可分 SVM線性不可分 核函數 SMO 重點:梯度下降法,拉格朗日乘子法,KKT條件 梯度下降法 梯度下降法常用於求解無約束情況下凸函數的極小值,是一種迭代類型的算法,

原创 k-近鄰算法學習筆記

k-近鄰算法學習筆記 基本概念   k-近鄰算法(K-Nearest Neighbor,KNN),是機器學習分類算法中最簡單的一類。採用測量不同特徵之間距離方法進行分類。通俗地說所謂k近鄰,就是k個最近的鄰居的意思,說的是每個樣本都可以用

原创 集成學習:隨機森林/GBDT/XGBoost (學習筆記一)

知識點: 隨機森林 提升算法 GBDT(迭代決策樹) Adaboost XGBoost Stacking 集成學習(Ensemble Learning) 集成學習的思想就是將若干個學習器(分類器&迴歸器)組合之後產

原创 決策樹--學習筆記(二)

決策樹分割屬性選擇 決策樹算法是一種“貪心”算法策略,只考慮在當前 數據特徵的情況下的最好分割方式,不能進行回溯操作。 對於整體的數據集而言,按照所有的特徵屬性進行劃分操作,對於所有劃分操作的結果集“純度”進行比較,選擇“純度”越高的特徵

原创 (EM算法)The EM Algorithm

(EM算法)The EM Algorithm       EM是我一直想深入學習的算法之一,第一次聽說是在NLP課中的HMM那一節,爲了解決HMM的參數估計問題,使用了EM算法。在之後的MT中的詞對齊中也用到了。在Mitchell的書中也

原创 【python系列】numpy中的tile函數——記錄

tile函數位於python模塊 numpy.lib.shape_base中,他的功能是重複某個數組。比如tile(A,n),功能是將數組A重複n次,構成一個新的數組, >>> import numpy >>> numpy.tile([0

原创 決策樹--學習筆記(一)

信息熵 決策樹 決策樹優化 剪枝 決策樹可視化                                               決策樹的直觀理解 比特化(bits) 假設存在一組隨機變量x,各個值出現的概