原创 第八週總結:2018-04-16~2018-04-20

完成:machine learning中使用scikit-learn對數據進行預處理(補全、非數字數據數字虛擬化)遺留問題:暫無

原创 python中遇到的問題

問題一E:\Anaconda3\lib\site-packages\sklearn\cross_validation.py:41: DeprecationWarning: This module was deprecated in ver

原创 hadoop cluster(第二篇)關閉防火牆問題

參考鏈接:1、http://blog.csdn.net/zhxdick/article/details/51942405(Hadoop集羣搭建)2、http://blog.csdn.net/u011831754/article/detai

原创 爲什麼(一)開始寫spark後來寫Hadoop

    看了標題估計也能猜到,因爲spark寫不下去了!!確實是這樣的。實際生成環境中spark的好多處理都是建立在spark集羣環境上的,需要Hadoop集羣(數據轉換存儲等操作)來配合spark,所以還