台部落盖建伟

原创 Hadoop序列化

一、序列化概念 1 序列化（Serialization）是指把結構化對象轉化爲字節流。 2 反序列化（Deserialization）是序列化的逆過程。即把字節流轉回結構化對象。 3 Jav

2020-02-22 23:09:00

原创 Hadoop之HDFS文件讀寫過程

一、HDFS讀過程 1.1 HDFS API 讀文件 Configuration conf = new Configuration(); FileSystem fs = FileSystem.get(con

2020-02-22 23:09:00

原创 hive入門

什麼是Hive Hive 是建立在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具，可以用來進行數據提取轉化加載（ETL ），這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。Hive 定

2018-08-25 16:04:09

原创 SVN與其他工具整合

【SVN與Eclipse整合】 SVN與Eclipse整合下載SVN插件(http://subclipse.tigris.org) 解壓到一個文件夾中進入eclipse 安裝目錄中dr

2018-08-25 16:04:09

2

原创 HBASE Shell

hbase提供了一個shell的終端給用戶交互名稱命令表達式創建表 create '表名稱', '列族名稱1','列族名稱2','列族名稱N' 添加記錄 put '表名稱', '行名稱', '列名

2018-08-25 16:04:09

2

原创 Hadoop之MapReduce-倒排索引案例

一、問題描述統計每個單詞在各個文件中出現的次數。二、所給數據 1. 輸入數據: a.txt: b.txt hello tom

2018-08-25 16:04:07

1

原创版本控制入門

【學習目標】掌握SVN服務端與客戶端的安裝與配置掌握SVN服務端權限配置掌握SVN在Eclipse中的使用【問題引入】參與過2人以上的軟件項目開發？開發過程中程序是否具有版本控制？如果不使用版本控制還會

2018-08-25 16:04:07

1

原创 Hbase簡介（很好的梳理材料）

一、簡介 history started by chad walters and jim 2006.11 G release paper on BigTable 2007.2 inital HBase prototype create

2018-08-25 16:04:06

原创 SVN入門（一）

【SVN簡介】 Svn（Subversion）是近年來崛起的版本管理工具，在當前的開源項目裏(J2EE)，幾乎95%以上的項目都用到了 SVN。Subversion 項目的初衷是爲了替換當年開源社區最爲流行的版本控制軟件

2018-08-25 16:04:06

5

原创 sqoop簡介及安裝

一、sqoop簡介 Sqoop是一個用來將Hadoop和關係型數據庫中的數據相互轉移的工具，可以將一個關係型數據庫（例如： MySQL ,Oracle ,Postgres等）中的數據導進到Hadoop的HDFS中，也可以將

2018-08-25 16:04:05

原创 Hbase集羣搭建

1.上傳hbase安裝包 2.解壓 3.配置hbase集羣，要修改3個文件（首先zk集羣已經安裝好了）【注意：要把hadoop的hdfs-site.xml和core-site.xml 放到hbase/conf下】 3.1修改h

2018-08-25 16:04:05

原创 Hbase的java接口

public class HbaseDemo { private Configuration conf = null; @Before public void init(){ conf = HBaseConfigurati

2018-08-25 16:04:05

2

原创 Hadoop序列化

原创 Hadoop之HDFS文件讀寫過程

原创 hive入門

原创 SVN與其他工具整合

原创 HBASE Shell

原创 Hadoop之MapReduce-倒排索引案例

原创版本控制入門

原创 Hbase簡介（很好的梳理材料）

原创 SVN入門（一）

原创 sqoop簡介及安裝

原创 Hbase集羣搭建

原创 Hbase的java接口

原创 hive安裝(單節點)

原创 Hadoop序列化案例

原创 Hadoop之MapReduce-Partition編程