原创 linux一些常用服務的安裝

1.ntp時間同步安裝 2.suse11離線安裝gcc 3.suse安裝redis

原创 特徵工程(如何合理地把非數值特徵轉換成數值特徵)

現在我理解的特徵工程的意義是:如何把非數值特徵轉換成數值特徵? 1、假如有一個屬性是職業,有這三種職業,教師、公務員、工程師,現在要用一個基於線性迴歸的算法,來訓練模型,假如f(x,y)=ax+by,a,b代表權重,x代表職業這

原创 感知器學習算法

1.

原创 機器學習入門

1.常用算法 決策樹 隨機森林算法 邏輯迴歸 SVM 樸素貝葉斯 Knn算法 K-means算法

原创 數學中一些定理

1、費馬定理 2、羅爾定理 3、拉格朗日中值定理 4、柯西中值定理 5、洛必達法則 6、泰勒中值定理 7、方向導數求導方法 8、全概率公式 9、貝葉斯公式 10、條件概率

原创 maven使用

1.修改aliyun鏡像 2.maven入門 3.解決jar包衝突 點贊 收藏 分享 文章舉報 一個脫離了高級趣味的人 發佈了38 篇原創文章 · 獲贊 1 · 訪

原创 sklearn入門

#導入保存模型工具包 from sklearn.externals import joblib #導入操作系統包 import os #定位到這個路徑 os.chdir("/Users/yeshuai/") #導入sklearn的

原创 BP神經網絡算法

參考 學了一個星期高數,我以一個初學者的身份來描述一下這個算法,希望我能講的通俗易懂。 1、在學習這個算法之前,先看一下如何解決下面這個問題。 有一組點{(2,3,5),(4,5,7),(6,8,10)},如何確定一條直線能

原创 knn算法

英文全稱k-nearst-neighbors 這是一個分類算法 工作原理: 比如,有一堆先驗數據,他們已經分好了類,把這一堆數據看成一個一個的點,他們有座標。現在來了一條測試數據(這條數據也相當於一個點,有座標),讓你對他進

原创 suse11離線安裝gcc

1.suse離線安裝gcc需要以下包 gcc-4.3-62.198.x86_64.rpm glibc-devel-2.11.3-17.31.1.x86_64.rpm gcc-c++-4.3-62.198.x86_64.rpm      

原创 K-means算法

此算法用於聚類 給你一些數據,他們的屬性已經被數字化,你這麼對他們進行聚類呢? k-means是這麼做的 其實只要一條數據是數字化的,就可以把他們看成一個點。我們把這些記錄看成一個點羣。 我們對一些事物進行分類,其實就是看

原创 隨機森林入門筆記

參考 1.如果說決策樹是一棵樹,那麼隨機森林就是多棵決策樹,隨機森林的出現其實就是對決策樹的補充和優化。 2.假如有一堆數據,原來是通過一個決策樹來建立模型做分類,現在是把這堆數據再分成k個數據堆,建立k個決策樹也就是k個模型

原创 kerberos學習筆記

之所以搞kerberos,是因爲我們一個項目是基於華爲的fusioninsght開發的,華爲的這套大數據平臺處處有kerberos認證,搞得我很是懵逼,下面是我的學習參考資料。不要參考我的。你一定會懵逼的。我自己記着自己用的。

原创 mysql

1.mac下卸載mysql sudo rm /usr/local/mysql sudo rm -rf /usr/local/mysql* sudo rm -rf /Library/StartupItems/MySQLCOM

原创 java工廠模式

1