原创 Hadoop生態之hdfs知識點總結

一、簡介 HDFS(Hadoop Distributed File System)是Hadoop項目的核心子項目,是分佈式計算中數據存儲管理的基礎,是基於流數據模式訪問和處理超大文件的需求而開發的,可以運行於廉價的商用服務器上。它所具有的

原创 Hadoop生態之HBase知識點總結

一、簡介 HBase是一種Hadoop數據庫,經常被描述爲一種稀疏的,分佈式的,持久化的,多維有序映射,它基於行鍵、列鍵和時間戳建立索引,是一個可以隨機訪問的存儲和檢索數據的平臺。HBase不限制存儲的數據的種類,允許動態的、靈活的數據模

原创 Hadoop生態之Hive知識點總結

一、簡介 Hive是建立在Hadoop HDFS上的數據倉庫基礎架構; Hive可以用來進行數據提取轉化加載(ETL); Hive定義了簡單的類似SQL查詢語言,稱之爲HQL它允許熟悉SQL的用戶查詢數據; Hive允許熟悉MapRedu

原创 《深入理解Java虛擬機》隨筆

程序設計語言,Java虛擬機,Java類庫統稱爲JDK。 Java Api類庫中的JavaSE Api子集和java虛擬機這兩部分統稱爲jre。 Java虛擬機運行時數據區 程序計數器 線程私有 當前線程所執行的字節碼的行號指示器