原创 Spark常見的Transformation算子(三)
Spark常見的Transformation算子(三) 初始化數據 println("======================= 原始數據 ===========================") val data1: RD
原创 Hadoop註解InterfaceAudience InterfaceStability
Hadoop註解InterfaceAudience InterfaceStabilityHadoop註解InterfaceAudience InterfaceStability1. InterfaceAudience2. Inte
原创 MapReduce編程實例
MapReduce編程實例MapReduce編程實例1. WordCount入門案例2. 最高氣溫3. 平均工資4. 手機流量統計 MapReduce編程實例 所有MapReduce用到的日誌數據,都可以在我的github中的re
原创 Sqoop錯誤
1. 導入時使用--split-by出錯 19/12/01 17:13:17 ERROR tool.ImportTool: Import failed: java.io.IOException: Generating splits
原创 MapReduce—平均工資
MapReduce—平均工資MapReduce—平均工資1. 需求分析2. 解答思路 MapReduce—平均工資 我這裏是使用集羣去處理這個日誌數據,數據在我的github上,默認使用maven去管理所有的jar包 gith
原创 啓停 Redis 集羣腳本
啓停 Redis 集羣腳本 因爲redis集羣在停止和啓動上都存在很大的繁瑣性,所以就寫了一個簡單的啓停redis集羣的腳本 關閉腳本 stop-redis.sh #!/bin/bash PORT=($1 $2) for por
原创 Kafka的操作
Kafka的操作 主題相關操作命令格式 # 格式 [yangqi@xiaoer kafka-2.3.1]$ ./bin/kafka-topics.sh --zookeeper xiaoer:2181,yangqi1:2181,ya
原创 Hbase之TTL
Hbase之TTLHbase之TTL(Time To Live)1. 前言2. 創建表emp進行測試3. 總結 Hbase之TTL(Time To Live) 1. 前言 今天剛剛接觸了Hbase一些知識,對其中的TTL(Time
原创 Hive整合Hbase之後數據的存儲位置淺談
Hive整合Hbase之後數據的存儲位置淺談Hive整合Hbase之後數據的存儲位置淺談1. 創建hive表2. 進入Hbase查看數據3. 在Hive中查詢這個表的數據4. 退出客戶端5. 總結 Hive整合Hbase之後數據的
原创 Hbase錯誤
1. 啓動HBase時報錯 2019-11-24 18:14:29,709 ERROR [main] regionserver.HRegionServerCommandLine: Region server exiting jav
原创 虛擬機中安裝CentOS7
虛擬機中安裝CentOS7 安裝CentOS7虛擬機 新建虛擬機 選擇自定義高級 點擊“下一步” 繼續“下一步”,選擇操作系統 點擊“下一步”,設置虛擬機名稱以及安裝位置 選擇CPU核心數和CPU個數 點擊下一步,設置
原创 ElasticSearch-7.3.0 進階語法
ElasticSearch-7.3.0 進階語法 elasticsearch官方文檔 字段類型 # Text:被分析索引的字符串類型 # Keyword:不能被分析只能被精確匹配的字符串類型 # Date:日期類型,可以配置 fo
原创 準實時索引搭建canal
準實時索引搭建canal canal 是阿里的一款中間件,source 爲 mysql,target 爲其他存儲,阿里的 canal 藉助於 mysql 主備同步的機制,僞裝成 mysql 的一個備庫,去感知 mysql 當中的
原创 Hbase shell常見語法
Hbase shell常見語法Hbase shell常見語法1. hbase-namespace2. hbase-table Hbase shell常見語法 連接到hbase shell hbase shell位於Hbase目錄
原创 使用IDEA和SBT構建Spark程序
使用IDEA和SBT構建Spark程序 1. 打開IDEA創建一個Scala項目,選擇sbt 2. 選擇合適的sbt版本和scala版本 3. 創建完成之後會從遠程服務器拉取一些項目的信息,可能比較慢 4. 完成後的項目結構