原创 elasticsearch+elasticsearch-head+kibana環境搭建(一)
文章目錄一、安裝node.js二、安裝Elasticsearch三、安裝elasticsearch-head監控elasticsearch集羣環境四、安裝Kibana 一、安裝node.js 安裝elasticsearch-hea
原创 Linux入門常用命令(一)
Linux常用命令 常用目錄 系統結構圖 一、目錄操作常用命令 pwd 查看當前路徑 cd 打開目錄 ls -a 查看目錄文件 ll 以列的方式顯示目錄下的文件列(等同與ls -l) mkdir 目錄名 創建文件目錄 rm
原创 解決Maven中添加依賴不提示
轉載:https://blog.csdn.net/qq_45085954/article/details/100977565 File-->Setting
原创 【Hadoop】(一) 分佈式環境搭建
文章目錄一、創建虛擬機配置基本環境二、無密登錄三、配置hadoop安裝配置 一、創建虛擬機配置基本環境 創建三臺虛擬機 1、下載jdk包 2、解壓配置環境變量 3、具體安裝步驟參考 https://blog.csdn.net/we
原创 IDEA打包發佈到Docker的Tomcat容器中
文章目錄一、保證工程的正確性二、檢查war包的運行環境是否OK 一、保證工程的正確性 2、使用Xftp工具將war包複製到centos中的opt目錄下,粗暴方法直接鼠標託進去 3、先在docker中啓動mysql和tomcat
原创 【Hive】(四)Hive函數——窗口函數
文章目錄窗口函數聚合函數+over()關鍵字partition by子句order by子句window 子句序列函數ntile排序 row_number rank dense_rankLAG和LEAD函數first_v
原创 【JDBC】Java操作數據庫
JDBC連接數據庫 一、JDBC 概念:JDBC(Java DataBase Connectivity) 是一種Java數據庫連接計數,能實現Java程序對各種數據庫的訪問。有一組使用Java語言編寫的類和接口組成,稱爲JDB
原创 【Hadoop】(三) Hadoop計算框架 MapReduce
文章目錄一、MapReduce1、什麼是MapReduce2、核心編程思想3、MapReduce進程4、切片與MapTask二、Hadoop序列化1、序列化與反序列化2、爲什麼要序列化3、爲什麼不用Java的序列化4、Hadoop
原创 【Hadoop】(二) Hadoop分佈式存儲HDFS
文章目錄Hadoop簡介Hadoop架構Hadoop核心之一HDFSHDFS寫文件HDFS讀文件 Hadoop簡介 大數據4V特徵 1.Volumn : 體量大 2.Velocity : 速度快 3.Variaty :
原创 【Spark】(三) Spark Core
文章目錄一、數據結構——RDD二、RDD實現World Count三、算子1、轉化算子transcation2、動作算子action3、引起shuffle過程的Spark算子四、寬窄依賴五、RDD緩存1、級別2、cache()、p
原创 【Spark】(二) Spark入門
文章目錄一、Spark架構1、Spark 內置模塊 1)Master 2)Worker 1)Driver(驅動器) 2)Executor(執行器)2、運行流程二、Spark的運行模式1、Local模式2、Standalo
原创 【Hive】(一)Hive環境搭建
前提先安裝好mysql和hadoop 安裝配置mysql 安裝配置hadoop 安裝配置hive 1.安裝包解壓移動 [root@yang opt]# tar -zxvf hive-1.1.0-cdh5.14.2.tar.gz [
原创 【Hive】(二)Hive入門——架構和基礎命令
文章目錄什麼是hivehive 體系架構Hive 和數據庫比較Hive數據類型數據表(Tables)表操作 刪除/修改 什麼是hive 基於Hadoop的數據倉庫解決方案 hive是基於Hadoop的一個數據倉庫工具,可以將結構化
原创 【HBase】(一) HBase安裝配置+JavaAPI
文章目錄一、安裝前提二、修改配置文件三、啓動Hbase四、Hbase API 一、安裝前提 1、Hadoop環境搭建 2、zookeeper環境搭建 找到官網下載 hbase 安裝包 hbase-1.2.0-bin.tar.gz,
原创 【Hive】(五)Hive函數—— 自定義函數
文章目錄一、UDF二、UDAF三、UDTF Hive函數 函數分類: 標準函數:一行數據中的一列或多列爲輸入,結果爲單一值 聚合函數:多行的零列到多列爲輸入,結果爲單一值 表生成函數:零個或多個輸入,結果爲多列或多行 自定義函