原创 Mybatis—Generator的使用

1.簡介 Mybatis—Generator是mybatis的一款代碼自動生成工具,能夠生成實體、mapper文件、dao的通用接口。在實際開發中能夠極大的節約時間,提高開發效率。 2.具體使用 2.1 引入插件依賴 <b

原创 Kylin-2.5.0安裝-詳細教程

Kylin安裝文檔 安裝包版本 系統:CentOS7 jdk:jdk-8u191-linux-x64 Hadoop:hadoop-2.9.2.tar hbase:hbase-1.2.7-bin.tar hive: apache-

原创 kylin異常整理

1.運行一段時間hadoop連接被拒絕 異常信息 java.io.IOException: java.net.ConnectException: Call From kylin/192.168.19.132 to 0.0.0.0

原创 Kylin的概述與架構

kylin概述 kylin的產生背景 Apache Kylin的初衷是解決千億條、萬億條記錄的秒級查詢問題,關鍵是打破查詢時間隨着數據量成線性增長的這個規律 Kylin的工作原理 Apache Kylin的工作原理本質上是MOLA

原创 Git

Git 項目的安全性太低 不能協同開發 不能版本回退 項目版本過多,出現混亂 git是什麼 git是一款分佈式版本控制及協同開發工具 版本控制工具的分類 目前分兩類 集中式版本控制系統 SVN 核心圖: [外鏈圖片轉

原创 Flink的窗口策略

概述 Windows是流計算的核心。Windows將流分成有限大小的“buckets”,我們可以在其上應用聚合計算表(ProcessWindowFunction, ReduceFunction,AggregateFunction

原创 Flink的安裝與開發環境搭建

Flink的安裝 前提條件 HDFS正常啓動(SSH免密人證) JDK 1.8+ Flink的安裝 上傳並解壓flink [root@CentOS ~]# tar -zxf flink-1.8.1-bin-scala_2.

原创 Java面試題 史上最全的中高級JAVA工程師-面試題彙總

原文鏈接:https://blog.csdn.net/shengqianfeng/article/details/102572691 原創 史上最全的中高級JAVA工程師-面試題

原创 Flink的DataStream API

參考: https://ci.apache.org/projects/flink/flink-docs-release-1.9/dev/datastream_api.html Data Sources Sources 是程序讀取其

原创 Flink的狀態管理

State 和Fault Tolerance(重點) 有狀態操作或者操作算子在處理DataStream的元素或者事件的時候需要存儲計算狀態,這就使得狀態在整個Flink的精細化計算中扮演着非常重要的地位: 記錄數據某一個過去時間

原创 Flink的基本概念與架構

概述 Flink是構建在數據流之上的一款有狀態計算框架。通常被人們稱爲第三代大數據分析方案。 第一代大數據處理方案:Hadoop Map Reduce 靜態批處理 | Storm實時流計算,兩套獨立的計算引擎,開發難度大。 第二代

原创 redis的安裝

安裝gcc的編譯環境 [root@CentOS ~]# yum install gcc Loaded plugins: fastestmirror Loading mirror speeds from cached hostf

原创 Spark-Stage劃分源碼剖析

Stage的劃分依據 Stage:每個任務會被劃分爲若干個階段,每個都有自己的並行度,階段與階段之間有相互的依賴關係。Stage的劃分依賴於(RDD血統),寬|窄依賴之間的關係。如果爲窄依賴則劃分爲一個Stage,如果爲寬依賴則建

原创 Idea與Git的集成

1.什麼是git git 是一款分佈式版本控制及協同開發工具。 2.版本控制工具的分類 集中式版本控制系統 S 核心圖 分佈式版本控制系統 Git 核心圖: 3. git的倉庫和版本庫的概念 3.git和IDEA集成

原创 Spark-RDD

RDD的概述 俯視整個Spark程序,所有Spark的Application都包含一個Driver程序,該程序是用戶的主函數以及在集羣中執行各種各樣的並行操作。Spark中提出了一個核心的概念 resilient distribu