原创 好記憶的機器學習面試--線性迴歸

文章目錄1.什麼是線性迴歸2. 能夠解決什麼樣的問題3. 一般表達式是什麼4. 如何計算4.1 Loss Function--MSE5. 過擬合、欠擬合如何解決5.1 什麼是L2正則化(嶺迴歸)5.2 什麼場景下用L2正則化5.3

原创 NLP從詞袋到Word2Vec的文本表示

目錄1.離散表示1.1 One-hot表示1.2 詞袋模型1.3 TF-IDF1.4 n-gram模型1.5 離散表示存在的問題2. 分佈式表示2.1 共現矩陣3.神經網絡表示3.1 NNLM3.2 Word2Vec3.3 sense

原创 《數學之美》

之所以會寫《數學之美》這本書的讀書筆記,是因爲我覺得這本書非常好,道出了數學上藝術的一面和美麗的一面。讓我感覺以前所學的數學都沒有白學,突然間變得有意義了,也更加的親切。同時,我也是很佩服我自己居然能夠在5天內讀完這本書,而且還是一本

原创 《數學之美》--第一章:文字和語言 vs 數字和信息

PDF下載 第一章 文字和語言 vs 數字和信息 數字、文字和自然語言一樣,都是信息的載體,它們之間原本有着天然的聯繫。語言和數學的產生都是爲了同一個目的—記錄和傳播信息。但是,直到半個多世紀前香農博士提出信息論,人們纔開始把數學和信

原创 通俗易懂--嶺迴歸(L2)、lasso迴歸(L1)、ElasticNet講解(算法+案例)

目錄1.L2正則化(嶺迴歸)1.1問題1.2公式1.3對應圖形1.4使用場景1.5代碼實現2.L1正則化(lasso迴歸)2.1公式2.2對應圖形2.3使用場景2.4代碼實現3.ElasticNet迴歸3.1公式3.2使用場景3.3代

原创 通俗易懂--模型集成(多模型)講解(算法+案例)

目錄1.信用卡欺詐預測案例2.模型集成(model ensemble)2.1Bagging2.2Stacking2.3Adaboost2.4圖解模型集成3.案例總流程4.初始化工作5.數據下采樣6.模型訓練6.1KNN6.2 SVM-

原创 通俗易懂--SVM算法講解(算法+案例)

標題1.SVM講解1.1支持向量機(SVM)的由來1.2如何找到超平面函數間隔幾何間隔1.3最大間隔分類器1.4後續問題1.5新聞分類實例 尋覓互聯網,少有機器學習通俗易懂之算法講解、案例等,項目立於這一問題之上,整理一份基本算法講解

原创 機器學習-線性迴歸預測房價模型demo

標題1.題目:2.步驟3.模型選擇4.環境配置5.csv數據處理6.數據處理7.模型訓練8.完整代碼 這篇介紹的是我在做房價預測模型時的python代碼,房價預測在機器學習入門中已經是個經典的題目了,但我發現目前網上還沒有能夠很好地做

原创 通俗易懂--線性迴歸算法講解(算法+案例)

標題1.線性迴歸(Linear Regression)1.1什麼是線性迴歸1.2線性迴歸要解決什麼問題1.3線性迴歸的一般模型1.4如何使用模型1.5模型計算1.6過擬合與欠擬合(underfitting and overfittin

原创 通俗易懂--決策樹算法、隨機森林算法講解(算法+案例)

標題1.決策樹1.1從LR到決策樹優點缺點決策樹的優點1.2“樹”的成長過程這顆“樹”長到什麼時候停1.3“樹”怎麼長信息增益1.3.1ID3算法1.3.2C4.51.3.3CART算法舉個例子1.3.4三種不同的決策樹1.4隨機森林

原创 《機器學習》(入門1-2章)

開篇前話       這篇筆記適合機器學習初學者,我是加入了一個DC算法競賽的一個小組,故開始入門機器學習,希望能夠以此正式進入機器學習領域。       在網上我也找了很多入門機器學習的教程,但都不讓人滿意,是因爲沒有一個以競賽的形

原创 通俗易懂--邏輯迴歸算法講解(算法+案例)

標題目錄1.邏輯迴歸(Logistic Regression)1.1邏輯迴歸與線性迴歸的關係1.2損失函數1.3多分類問題(one vs rest)1.4邏輯迴歸(LR)的一些經驗1.5LR的應用1.6Python代碼實現 尋覓互聯網

原创 Cloudera Manager(簡稱CM)+CDH構建大數據平臺

標題一、Cloudera Manager介紹1.CM技術架構2.CM四大功能3.分析表格4.本教程使用虛擬機配置二.服務器集羣時間同步1.配置時間爲中國的時區2.ntp時間同步服務器安裝3.配置ntp4.啓動ntp服務5.其它節點進行