原创 第八週總結:2018-04-16~2018-04-20
完成:machine learning中使用scikit-learn對數據進行預處理(補全、非數字數據數字虛擬化)遺留問題:暫無
原创 python中遇到的問題
問題一E:\Anaconda3\lib\site-packages\sklearn\cross_validation.py:41: DeprecationWarning: This module was deprecated in ver
原创 hadoop cluster(第二篇)關閉防火牆問題
參考鏈接:1、http://blog.csdn.net/zhxdick/article/details/51942405(Hadoop集羣搭建)2、http://blog.csdn.net/u011831754/article/detai
原创 爲什麼(一)開始寫spark後來寫Hadoop
看了標題估計也能猜到,因爲spark寫不下去了!!確實是這樣的。實際生成環境中spark的好多處理都是建立在spark集羣環境上的,需要Hadoop集羣(數據轉換存儲等操作)來配合spark,所以還