原创 Java Spark自定義累加器的實現
Spark自定義累加器需要實現 AccumulatorParam !!!!!! 需要注意的是 ,源碼中給出 也就是說兩個方法的實現是不一樣的。 下面是我的實現 TimeAccumulator.java import consta
原创 spark transformation算子
一、什麼是RDD算子 答:所謂RDD算子,就是RDD中定義的函數,可以對RDD中的元素進行轉換和操作。 二.算子的分類 算子分爲兩類:轉換算子(Transformation)和行動算子(Action)。 轉換算子(Transforma
原创 Ubuntu上Jenkins搭建過程
原文鏈接:https://www.cnblogs.com/big-ming/p/12523117.html 參考鏈接:https://blog.csdn.net/luoww1/article/details/100095889 一、Jen
原创 Ubuntu16.04上安裝MySQL(詳細過程)
原文鏈接:https://blog.csdn.net/weixin_42209572/article/details/98983741 一、安裝MySQL 1、使用以下命令即可進行mysql安裝,注意安裝前先更新一下軟件源以獲得最新版
原创 Ubuntu16.04下,erlang安裝和rabbitmq安裝步驟
原文鏈接:https://www.cnblogs.com/shanfeng1000/p/11951703.html 準備工作,先下載erlang和rabbitmq的安裝包,注意他們的版本,版本不對可能會導致rabbitmq無法啓動,這裏我
原创 spark記錄(20)自定義累加器Accumulator
自定義累加器 /** * 自定義累加器需要繼承AccumulatorV2<IN,OUT>類 * 並且要指定要累加的類型 */ public class MyAccumulator extends AccumulatorV2<MyK
原创 MySQL Community Server 8.0.11下載與安裝配置
原文地址:https://www.cnblogs.com/limn/p/9359063.html 一、下載 1、選擇合適的安裝包,我在這裏下載的是目前最新的安裝包,8.0.11,而且我選擇下載的是解壓版的,安裝版的話,安裝會比較麻煩。 M
原创 使用Git設置遠程Remote倉庫時顯示authentication failed for xxx錯誤
原文鏈接:https://blog.csdn.net/h927974926/article/details/100031003 錯顯示:Invalid Remote Remote URL test fa
原创 spark記錄(18)SparkStreaming+kafka receiver和directed模式
一、receiver模式 1 、receiver模式原理圖 2 receiver模式理解: 在SparkStreaming程序運行起來後,Executor中會有receiver tasks接收kafka推送過來的數據。數據會被持久化,默
原创 Spark Streaming之updateStateByKey以及基於緩存的實時wordcount程序
updateStateByKey updateStateByKey操作,可以讓我們爲每個key維護一份state,並持續不斷的更新該state。 首先,要定義一個state,可以是任意的數據類型; 其次,要定義state更新函數——指定一
原创 Spark Streaming(三):DStream的transformation操作
收藏鏈接:https://www.jb51.net/article/163065.htm 1、updateStateByKey 作用 可以讓我們爲每個key維護一份state,並持續不斷的更新該state; 使用 1、首先,
原创 Redis(五):常見面試題目詳解
1、什麼是Redis Redis 是一個基於內存的高性能 key-value數據庫。支持多種數據類型 2、簡單描述Redis的特點 Redis本質上是一個key-value類型的內存數據庫,很像memcached,整個數據庫統統加載在內存
原创 分佈式鎖zookeeper面試
來源https://github.com/shishan100/Java-Interview-Advanced 面試題 zookeeper 都有哪些使用場景? 面試官心理分析 現在聊的 topic 是分佈式系統,面試官跟你聊完了 dubb
原创 分佈式緩存Redis面試題
來源:https://github.com/shishan100/Java-Interview-Advanced 面試題 redis 和 memcached 有什麼區別?redis 的線程模型是什麼?爲什麼 redis 單線程卻能支撐高併
原创 kafa面試問題
參考:https://github.com/shishan100/Java-Interview-Advanced 爲什麼使用消息隊列?消息隊列有什麼優點和缺點?Kafka、ActiveMQ、RabbitMQ、RocketMQ 都有