原创 Spark入門( 八)——Spark流計算新玩法-Structured Streaming

Structured Streaming簡介快速入門案例程序流程結構基本概念故障容錯Structured Streaming APIInput SourcesFile SourceSocket source(debug)Kafka

原创 Spark入門(七)——最全的Saprk SQL算子介紹與使用(下)

Spark SQL 查詢SQL語法查詢單行查詢模糊查詢排序查詢limit查詢分組查詢having過濾case-when行轉列pivotCube計算Join表連接子查詢開窗函數開窗函數SQL解讀ROW_NUMRANK()DENSE_

原创 Spark入門(五)——Spark Streaming

Spark Streaming(流處理)Spark Streaming(流處理)什麼是流處理?快速入門概念介紹初始化 StreamingContextDiscretized Streams (DStreams)InputStrea

原创 Spark入門(六)——最全的Saprk SQL算子介紹與使用(上)

Spark SQLDatasets & DataFrames簡介快速入門Dataset & DataFrame實戰Dataset createcase-classTuple(元組)json數據RDDDataframe create

原创 大數據學習(1)-Hadoop HDFS基礎分佈式集羣搭建及使用

HDFS分佈式集羣搭建【基礎版】環境:以CentOS6.5爲例準備配置文件修改配置Hadoop環境變量NameNode格式化啓動|停止hadoop【在NameNode節點運行】shell訪問HDFS瀏覽器訪問HDFC 環境:以Ce