原创 MepReduce綜述

MapReduce MapReduce 是一種計算模型,該模型可將大型數據處理任務分解成很多個計算單元,在服務器集羣中並行執行的任務。這些人物的計算結果可以合併在一起來計算最終的結果。 MapReduce編程模型是由谷歌(Goog

原创 超詳細的HDFS讀寫流程詳解(最容易理解的方式)

HDFS採用的是master/slaves這種主從的結構模型管理數據,這種結構模型主要由四個部分組成,分別是Client(客戶端)、Namenode(名稱節點)、Datanode(數據節點)和SecondaryNameNode。H

原创 教你怎麼查看 hive 的執行計劃

編譯器中的實現細節 我們在總結Hive架構的時候,我們知道Hive中有一個Compiler組件,這個組件主要是解析字符串的SQL,然後生成執行計劃,我們介紹文章主要是詳細講解Compiler中的細節以及生成的執行計劃 我們從下面的

原创 數據倉庫系統架構流程圖

個人理解的數據倉庫系統架構設計流程圖 整合了自己已有的知識還有網絡上公開的知識做出來的兩幅圖 考慮不周如有問題,還請不吝賜教 涉及的主要流程 涉及的具體技術

原创 PostgreSQL 元命令介紹

PostgreSQL元命令介紹 postgresql中的元命令是指以 \(反斜線)開通的命令,怕失去了,提供的豐富的元命令,能夠便捷地管理數據庫,比如查看數據庫對象的定義,查看數據庫對象佔用空間的大小,列出數據庫各種對象名稱,