原创 大數據IMF傳奇行動絕密課程第85課:基於HDFS的SparkStreaming案例實戰和內幕源碼解密

基於HDFS的SparkStreaming案例實戰和內幕源碼解密 1、Spark Streaming on HDFS實戰 2、Spark Streaming on HDFS源碼解密 hadoop dfs -mkdir /libr

原创 大數據IMF傳奇行動絕密課程第100-101課:使用Spark Streaming+Spark SQL+Kafka+FileSystem綜合案例

使用Spark Streaming+Spark SQL+Kafka+FileSystem綜合案例 1、項目分析流程圖 2、項目代碼實戰 Flume sink到Kafka需要一個jar包支持 https://github.co

原创 大數據IMF傳奇行動絕密課程第84課:圖解StreamingContext、DStream、Receiver並結合源碼分析

圖解StreamingContext、DStream、Receiver並結合源碼分析 1、原理流程圖 2、源碼初探

原创 大數據IMF傳奇行動絕密課程第86課:SparkStreaming數據源Flume實際案例分享

SparkStreaming數據源Flume實際案例分享 1、Flume簡要介紹 2、Spark Streaming on Flume案例介紹 一、什麼是Flume?   flume 作爲 cloudera 開發的實時日誌

原创 大數據IMF傳奇行動絕密課程第97課:使用SparkStreaming+SparkSQL實現在線動態計算出特定時間窗口

使用SparkStreaming+SparkSQL實現在線動態計算出特定時間窗口下的不同種類商品中的熱門商品排名 1、Streaming+SQL技術實現解析 2、Streaming+SQL實現實戰 啓動hive metastor

原创 大數據IMF傳奇行動絕密課程第98-99課:使用Spark Streaming實戰對論壇網站動態行爲的多維度分析

使用Spark Streaming實戰對論壇網站動態行爲的多維度分析 1、技術分析 2、實現實戰 package com.tom.spark.SparkApps.sparkstreaming; import java.io.P

原创 大數據IMF傳奇行動絕密課程第81課:一節課貫通Spark SQL工作源碼流程

一節課貫通Spark SQL工作源碼流程 點贊 收藏 分享 文章舉報 tom_8899_li 發佈了125 篇原創文章 · 獲贊 5 · 訪問量 6萬+ 私信

原创 大數據IMF傳奇行動絕密課程第95課:通過SparkStreaming的window操作實戰模擬新浪微博、百度、京東等熱點搜索詞案例實戰

通過SparkStreaming的window操作實戰模擬新浪微博、百度、京東等熱點搜索詞案例實戰 1、在線熱點搜索詞實現解析 2、SparkStreaming實現在線熱點搜索詞實戰 package com.tom.spark.

原创 大數據IMF傳奇行動絕密課程第103課:動手實戰Spark Streaming Broadcast、Accumulator實現在線黑名單過濾和計數

動手實戰Spark Streaming Broadcast、Accumulator實現在線黑名單過濾和計數 1、自定義Receiver分析 2、自定義Receiver實戰 package com.tom.spark.SparkA

原创 大數據IMF傳奇行動絕密課程第94課:SparkStreaming實現廣告計費系統中在線黑名單過濾實戰

SparkStreaming實現廣告計費系統中在線黑名單過濾實戰 1、在線廣告黑名單過濾實現解析 2、SparkStreaming實現在線黑名單過濾實戰 package com.tom.spark.sparkstreaming

原创 大數據IMF傳奇行動絕密課程第87課:Flume推送數據到Spark Streaming案例實戰和內幕源碼解密

Flume推送數據到Spark Streaming案例實戰和內幕源碼解密 1、Flume on HDFS案例回顧 2、Flume推送數據到Spark Streaming實戰 3、原理繪圖剖析 一、配置.bashrc vi

原创 大數據IMF傳奇行動絕密課程第93課:SparkStreaming updateStateByKey案例實戰和內置源碼解密

SparkStreaming updateStateByKey案例實戰和內置源碼解密 1、sparkStreaming中的updateStateByKey案例實戰 2、sparkStreaming中的updateStateByK

原创 大數據IMF傳奇行動絕密課程第96課:通過SparkStreaming的foreachRDD把處理後的數據寫入外部存儲系統中

通過SparkStreaming的foreachRDD把處理後的數據寫入外部存儲系統中 1、技術實現解析 2、實現實戰 關鍵部分代碼: resultRowRDD.foreachPartition( partiti

原创 大數據IMF傳奇行動絕密課程第83課:透徹講解使用Scala和Java兩種方式實戰Spark Streaming開發

透徹講解使用Scala和Java兩種方式實戰Spark Streaming開發 /** * java 代碼 */ package com.tom.spark.SparkApps.sparkstreaming; impo

原创 大數據IMF傳奇行動絕密課程第102課:動手實戰Spark Streaming自定義Receiver並進行調試和測試

動手實戰Spark Streaming自定義Receiver並進行調試和測試 1、自定義Receiver分析 2、自定義Receiver實戰 http://spark.apache.org/docs/latest/stream