原创 玩玩i++

環境爲vs2012 // ConsoleApplication1.cpp : 定義控制檯應用程序的入口點。 // #include "stdafx.h" #include<iostream> using namespace st

原创 python數據分析基礎0_NumPY

NumPY 2.Numpy之ndarray對象 標準安裝的Python中用列表(list)保存一組值,可以用來當作數組使用,不過由於列表的元素可以是任何對象,因爲列表中保存的是對象的指針。這樣爲了保存一個簡單的[1,2,3],需要

原创 Hadoop2環境搭建

#-Hadoop僞分佈模式HDFS+YARN 1. 下載 Hadoop2.5.2 1.1. 在 Apache Hadoop 官網 http://hadoop.apache.org/上下載,點擊 Download Hadoop 連接。

原创 C++ OOP (BigThree & Pass by Reference & Return by Reference & Point & Template)

template<typename Object> class Vector { public: explicit Vector( int initSize = 0 ) //顯示構造函數,不允許compiler進

原创 AVL_lzw

#include<iostream> #include<stdlib.h> using namespace std; //1.AVL樹數據結構 struct BinaryTreeNode { int key; in

原创 Installing & Building Spark Environments

搭建步驟: //20170810 週四下午 安裝與部署spark環境 ************************************************************************************

原创 Scala Basics

//20170809 週三 #def patch [B >: Char, That] (from: Int, patch: GenSeq[B], replaced: Int) (implicit bf: CanBuildFrom(Stri

原创 Spark之sbt安裝

下載sbt-launch.jar,並存放至/usr/local/sbt [root@master sbt]# pwd /usr/local/sbt [root@master sbt]# ls sbt sbtlaunch sbt-lau

原创 日常小記整理

////////////////////////computer graph experiment resource//////////////////////// //圖形的區域填充 http://blog.csdn.net/xiao

原创 python數據分析基礎4_參考博文

一、pandas學習參考筆記 1.No module named ‘xlrd’ https://zhidao.baidu.com/question/986204803031542099.html 2.pd.read_excel(‘文件名

原创 日常小記整理2

-cat只能看明文的數據 -text可以看壓縮的數據 //更新:20170224晚7點 星期五 **對mapreduce輸出進行壓縮 mapred.output.compress=true mapred.output.compres

原创 sbt構建Scala項目_helloworld

1. $mkdir ~/simpleapp $mkdir ~/simpleapp/src $mkdir ~/simpleapp/src/main $mkdir ~/simpleapp/src/main/scala $vim SimpleA

原创 Hadoop2_mapreduce_wordcount

[root@master mapreduce_wordcount_python]# ls map.py red.py run.sh The_Man_of_Property.txt [root@master mapreduce_wor

原创 Spark by Scala_worldcount

代碼 import org.apache.spark.SparkContext import org.apache.spark.SparkContext._ import org.apache.spark.SparkConf objec

原创 大數據相關業務

搜索引擎 Google三駕馬車GFS,MapReduce,Bigtable初衷就是用於搜索領域。 1.搜索引擎涉及以下3部分: 1).爬蟲——數據收集中心,一個互聯網世界的縮影 2).索引系統——分析整理爬蟲收集到的資源,爲檢索系統提供