原创 Java集合分析
一、JAVA集合的框架圖 常見集合的架構圖: 二、Set的底層實現 HashSet 它的構造函數 public HashSet() { map = new HashMap<>(); } 從上面的
原创 JAVA I/O(三)
文件創建 調用方法:createNewFile() 這個方法會拋出一個IOException的異常 File file = new File("D:/1.txt"); file.createNewFile(); 對於cr
原创 JAVA I/O (二)
如何通過文件的遞歸來實現獲取指定文件的大小 一、聲明類FileTools public class FileTools { /** * 返回文件的大小 * @param file 文件或目錄對象
原创 JAVA I/O(四)
IO流的編碼與解碼 對於純文本文件來說,我們通常會遇到下面這個問題: 我們有一個文件爲utf8格式的文本文件(如:utf8.txt);另一個文件是GBK格式的文件(如:gbk.txt),這個時候我們希望把utf8.txt
原创 Hive工具的介紹(一)
一、Hive是什麼 要了解Hive是什麼得先了解一下數倉(數據倉庫)的概念,什麼又是數據倉庫呢? 數據倉庫的目的是爲了協助輸出分析報告,支持決策,爲需要業務智能的企業提供業務流程的改進和指導,從而可以節省時間和成本,提高質量。 數據倉庫
原创 JAVA I/O (一)
一、關於I/O 什麼是I/O? I:Input 輸入 O:output 輸出 這裏的輸入、輸出是針對於當前的應用程序而言的。 輸出:應用程序把數據輸出到:"控制檯"、“文件”、“網絡”、“打印機”…… 輸入:把數據讀取到應用程序中:“鍵盤
原创 使用IntelliJ IDEA 生成Struts2框架應用實例Hello World
使用IntelliJ IDEA 生成Struts2框架應用實例Hello World 當在Struts2的web應用程序中點擊一個超鏈接或提交一個HTML表單時,會由控制器收集輸入併發送一個叫Actions的Java類。 Action被執
原创 HBase簡介(一)
HBase屬於列式非關係型婁據庫(NoSQL),在介紹HBse則先了解NoSQL。 一、關於NoSQL 什麼是NoSQL? NoSQL(Not Only SQL),它是一個通用的述語,也就是非關係型數據庫,它並不是以sql
原创 Hive工具介紹(三)
Hive表的相關操作 Hive是一個數據倉庫,它可以把結構化的數據文件映射爲一張數據庫表,並且有SQL語言的查詢功能。 注意:一般來說數據倉庫存放的是一些歷史數據,它的作用是用來做查詢分析,往往不會用來做單條記錄的增加、刪除、修改 H
原创 Hive工具介紹(二)
Hive的安裝及配置 一、Mysql安裝 安裝MySQL可以基於yum進行安裝 安裝mysql數據庫 yum install -y mysql-server 對數據庫的字符集進行配置 vi /e
原创 YARN-Hadoop集羣資源管理系統
YARN:Yet Another Resource Negotiator,它是在Hadoop2.0版本中出現的。YARN是一個集羣資源管理系統,負責集羣的統一管理和調度。 類似分佈式操作系統 Master/Slave架構 管理
原创 MapReduce分佈式離線計算框架學習摘要(一)
一、MapReduce簡單概述 在Hadoop中有兩個核心的模塊,一個是大數據量文件的存儲HDFS,另一個是能夠做快速的數據分析,則爲MapReduce。 百度百科介紹: 二、MapReduce的特點 它適合做“離線”(存儲在本地)的海
原创 MapReduce分佈式離線計算框架學習摘要,時間溫度排序(二)
對溫度進行排序實例(實例來源於《從零開始學Hadoop大數據分析》) 如有下溫度數據,根據這些溫度信息找出每年每月3個最高溫度的年月及溫度並按照溫度進行降序排列 2010-01-01 12:00:21 8 2010-01-02 12
原创 使用JAVA API調用ZooKeeper
一、環境準備及創建會話實例 JAR包 使用JAVA API調用ZooKeeper時必須要導入對應的jar包 對應的jar包:ZooKeeper-3.x.x.jar(其中的x需要依據版本而定。注意:使用
原创 Zookeeper基礎概念及基本命令簡介
關於Zookeeper需要了解的核心概念及常用命令 在分佈式系統構建的集羣中,每臺機器都有自己的角色定位,其中最爲典型的就是Master/Slave模式 Master:提供寫操作服務 Slave:通過異步複製的機制獲取新數據並提供讀服務