台部落senga07

Hadoop核心組件之分佈式文件系統HDFS 概述源自於Google的GFS論文，論文發表於2003年10月 HDFS是GFS的克隆版 HDFS特點：擴展性&容錯性&海量數據存儲特性將文件切分成指定大小的數據塊並以多

2020-02-25 22:48:47

MapJoin 適用場景：一張大表和一張小表小表的定義：在Hive中，是由hive.mapjoin.smalltable.filesize參數決定的，該參數的默認值爲10M。特點：在Map端完成Join，沒有Shuffle

2020-02-25 22:48:47

目標將A服務器上的日誌實時採集到B服務器技術選型配置文件 A服務器Flume配置文件：exec_memory_avro.conf exec_memory_avro.sources = exec_source exec_me

2020-02-25 22:48:47

Spark SQL的架構實例分析 spark-sql> explain extended select * from emp e inner join dept d on e.deptno = d.deptno where e

2020-02-25 22:48:47

下載官網地址需要科學上網目錄下載解壓後可以看到以下目錄結構 2.修改配置我們進入到conf目錄下，複製zeppelin-env.sh.template文件命名爲zeppelin-env.sh$ cp zeppeli

2020-02-25 22:48:47

離線作業執行流程通過MapReduce進行數據清洗，得到ETL數據創建Hive表，加載ETL數據進行各種維度的統計，並寫入到Hive表中將Hive表中的數據導出到MySql（optional，可利用Sqoop框架實現該功

2020-02-25 22:48:47

設置配置文件$SPARK_HOME/conf/spark-env.sh $ cd $SPARK_HOME/conf $ cp spark-env.sh.template spark-env.sh $ vim spark-env

2020-02-25 22:48:47

爲什麼要使用Spring 衆所周知，現在最流行的三大框架就是Spring、Spring MVC和Mybaits，那麼爲什麼要使用Spring？使用Spring給我們帶來了什麼好處呢？我帶着這個問題查了一些資料，其實回答的內容都是大同小

2018-12-12 14:56:48

2018-08-22 23:15:02

2018-08-22 23:15:02

2018-08-22 23:15:02

進入sbin目錄後執行以下命令. 1. 啓動nginx: ./nginx 2. 關閉nginx: ./nginx -s quit 3. 重啓nginx: ./nginx -s reload 4. 指定配置文件:

2018-08-22 23:15:02

2018-08-22 23:15:02

2018-08-22 23:15:02

2018-08-22 23:15:01