原创 不同Hive SQL下轉換成MapReduce的情況

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄Hive概念MapReduce實現基本SQL操作的原理join實現group by實現d

原创 Kafka數據一致性

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄數據存儲Topic邏輯結構多Parition的優點/缺點Partition存儲結構根據o

原创 MapReduce模型過程詳解

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄MapReduce過程從客戶端、jobTracker、taskTracker角度講(Ma

原创 HDFS的優缺點

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄HDFS優點HDFS缺點 HDFS優點 高容錯性:數據自動保存多個副本,副本丟失後,自

原创 MapReduce的數據傾斜及其優化方式

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄MapReduce的數據傾斜和解決方式數據傾斜解決方法MapReduce的優化方式 Ma

原创 Flume怎麼保證數據傳輸的完整性

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄Flume的事物機制Flume的At-least-once提交方式Flume的批處理機制

原创 Hbase與Hive數據同步

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄同步過程 同步過程 在Hbase中創建一張表create ‘user_sysc’, {

原创 Flume、Kafka、Hbase、Hive適用場景

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄Flume、Kafka適用場景Hbase適用場景Hive適用場景 Flume、Kafka

原创 ZooKeeper動態添加或刪除節點

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄配置需求動態添加節點動態刪除節點 配置需求 序號 目前配置 myid 需求配置

原创 Linux中&&、&、|、||等特殊符號

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄&& 和 &| 和 ||> 和 >>&> 、2>&1 和 2>1 && 和 & & 表

原创 幾種常見的Shell:sh、bash、tcsh、csh、zsh、ash的區別

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄概念shcshtcshashbash查看 Shell 概念 Linux 是一個開源的操作

原创 git常用命令

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄專用名詞新建代碼庫配置增加/刪除代碼代碼提交分支查看信息標籤遠程同步撤銷其他 專用名詞

原创 ps命令、pstree命令

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄ps(報告當前系統的進程狀態)ps實例pstree(查看進程樹)pstree實例 ps(

原创 grep命令、find命令

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄find命令find命令常用選項及實例find與xargs結合grep命令grep命令的

原创 awk命令

@Author : Spinach | GHB @Link : http://blog.csdn.net/bocai8058 文章目錄awk命令格式awk腳本基本格式awk執行過程分析awk內置變量將外部變量值傳遞給awk