原创 elasticsearch+elasticsearch-head+kibana環境搭建(一)

文章目錄一、安裝node.js二、安裝Elasticsearch三、安裝elasticsearch-head監控elasticsearch集羣環境四、安裝Kibana 一、安裝node.js 安裝elasticsearch-hea

原创 Linux入門常用命令(一)

Linux常用命令 常用目錄 系統結構圖 一、目錄操作常用命令 pwd 查看當前路徑 cd 打開目錄 ls -a 查看目錄文件 ll  以列的方式顯示目錄下的文件列(等同與ls -l) mkdir 目錄名  創建文件目錄 rm

原创 解決Maven中添加依賴不提示

轉載:https://blog.csdn.net/qq_45085954/article/details/100977565 File-->Setting

原创 【Hadoop】(一) 分佈式環境搭建

文章目錄一、創建虛擬機配置基本環境二、無密登錄三、配置hadoop安裝配置 一、創建虛擬機配置基本環境 創建三臺虛擬機 1、下載jdk包 2、解壓配置環境變量 3、具體安裝步驟參考 https://blog.csdn.net/we

原创 IDEA打包發佈到Docker的Tomcat容器中

文章目錄一、保證工程的正確性二、檢查war包的運行環境是否OK 一、保證工程的正確性 2、使用Xftp工具將war包複製到centos中的opt目錄下,粗暴方法直接鼠標託進去 3、先在docker中啓動mysql和tomcat

原创 【Hive】(四)Hive函數——窗口函數

文章目錄窗口函數聚合函數+over()關鍵字partition by子句order by子句window 子句序列函數ntile排序 row_number rank dense_rankLAG和LEAD函數first_v

原创 【JDBC】Java操作數據庫

JDBC連接數據庫 一、JDBC ​ 概念:JDBC(Java DataBase Connectivity) 是一種Java數據庫連接計數,能實現Java程序對各種數據庫的訪問。有一組使用Java語言編寫的類和接口組成,稱爲JDB

原创 【Hadoop】(三) Hadoop計算框架 MapReduce

文章目錄一、MapReduce1、什麼是MapReduce2、核心編程思想3、MapReduce進程4、切片與MapTask二、Hadoop序列化1、序列化與反序列化2、爲什麼要序列化3、爲什麼不用Java的序列化4、Hadoop

原创 【Hadoop】(二) Hadoop分佈式存儲HDFS

文章目錄Hadoop簡介Hadoop架構Hadoop核心之一HDFSHDFS寫文件HDFS讀文件 Hadoop簡介 大數據4V特徵 1.Volumn : 體量大 2.Velocity : 速度快 3.Variaty :

原创 【Spark】(三) Spark Core

文章目錄一、數據結構——RDD二、RDD實現World Count三、算子1、轉化算子transcation2、動作算子action3、引起shuffle過程的Spark算子四、寬窄依賴五、RDD緩存1、級別2、cache()、p

原创 【Spark】(二) Spark入門

文章目錄一、Spark架構1、Spark 內置模塊  1)Master  2)Worker  1)Driver(驅動器)  2)Executor(執行器)2、運行流程二、Spark的運行模式1、Local模式2、Standalo

原创 【Hive】(一)Hive環境搭建

前提先安裝好mysql和hadoop 安裝配置mysql 安裝配置hadoop 安裝配置hive 1.安裝包解壓移動 [root@yang opt]# tar -zxvf hive-1.1.0-cdh5.14.2.tar.gz [

原创 【Hive】(二)Hive入門——架構和基礎命令

文章目錄什麼是hivehive 體系架構Hive 和數據庫比較Hive數據類型數據表(Tables)表操作 刪除/修改 什麼是hive 基於Hadoop的數據倉庫解決方案 hive是基於Hadoop的一個數據倉庫工具,可以將結構化

原创 【HBase】(一) HBase安裝配置+JavaAPI

文章目錄一、安裝前提二、修改配置文件三、啓動Hbase四、Hbase API 一、安裝前提 1、Hadoop環境搭建 2、zookeeper環境搭建 找到官網下載 hbase 安裝包 hbase-1.2.0-bin.tar.gz,

原创 【Hive】(五)Hive函數—— 自定義函數

文章目錄一、UDF二、UDAF三、UDTF Hive函數  函數分類: 標準函數:一行數據中的一列或多列爲輸入,結果爲單一值 聚合函數:多行的零列到多列爲輸入,結果爲單一值 表生成函數:零個或多個輸入,結果爲多列或多行 自定義函