原创 第27周總結:2018-07-02~2018-07-06

   週數記錄修改:a、從2018年春節過後開始上班的第一週算第一週的話,2018-07-02~2018-07-06就是第19周!                           b 、從2018年01月01日開始計算第一週的話,20

原创 python腳本需要注意的小細節

1、格式,對齊(影響程序的邏輯)2、函數的返回值

原创 根據SVR(support vector regression)幫助HR評判新員工的薪資

處理的數據:Position,Level,SalaryBusiness Analyst,1,45000Junior Consultant,2,50000Senior Consultant,3,60000Manager,4,80000Cou

原创 第四周總結(2018-03-19~2018-03-23)

    很明顯,工作忙起來,學習的時間就少了完成:1、RDD創建、RDD基本操作2、上次的遺留問題解決:開發環境中導入相關的依賴就解決了,我具體導入了jdk、本地scala安裝路徑問題解決,不是大問題。

原创 第13周總結:2018年05-21~2018年05-25

完成:1、2篇機器學習博客          2、重新開始寫周總結(習慣很重要!)

原创 第14周總結:2018年05-28~2018年06-01

完成:1、讀取Excel文件並讓數據入庫!(當然這是工作中的事兒,但是我這周目前爲止還沒有學習AI的知識,所以記錄一下除AI之外所做的事兒!)2、學習《數據結構》中的“線性結構”這部分知識!每週都要做點什麼,不然周總結中午內容可寫。重要的

原创 第三週總結(2018-03-12~2018-03-16)

完成:1、Hadoop單節點集羣(僞分佈式Pseudo-Distributed Operation)搭建成功遺留問題:1、intelligent idea環境中運行報錯Exception in thread "main" java.lan

原创 第五週總結:2018-03-26~2018-03-30

完成:    RDD持久化、廣播、排序遺留問題:1、累加器2、高級排序、topN3、沒有學學習博客(RDD持久化、廣播、累加、排序、topN)

原创 第15周總結:2018年06-04~2018年06-08

完成:1、k-Means以及其延伸k-Means++的學習

原创 第七週總結:2018-04-08~2018-04-13

第六週清明放假3天沒有學習。完成:python編程實現多層次神經網絡、實現forward propagation功能、實現back propagation遺留問題:暫無

原创 使用random forest regression幫助HR精確的判斷新員工的薪資

    使用的數據還是上一篇博客https://blog.csdn.net/HereIcome/article/details/80435395中的數據,只是訓練的模型使用random forest regression模型。from s

原创 k-Means的陷阱

k-Means的5個step(how did it do that?):step 1 : choose the number K of clustersstep 2 : select at random k points , the ce

原创 scala環境變量與依賴版本不一致報錯

錯誤信息:java.lang.NoSuchMethodError: scala.math.Ordered.$init$(Lscala/math/Ordered;)V查看本地scala版本,如下C:\Users\Administrator>

原创 Decision Tree Regression幫助HR評估新員工的薪資區間

我所理解decision tree的切入點是兩張圖:這兩張圖表示的意思是一樣的,都是將已有的數據歸類。預測使用的數據:Position,Level,SalaryBusiness Analyst,1,45000Junior Consulta

原创 第二週總結(2018-03-05~2018-03-09)

    又一週結束 了,這周感覺很漫長,因爲週二遇到困難進行不下去了。還好走出來了!完成:1、破解了SecureCRT,可以使用WinSCP遠程文件同步操作2、Hadoop的local mode跑通遺留問題:1、intelligent i