原创 Java多線程併發編程學習

Java多線程併發編程學習筆記 關鍵字:java.util.concurrent;Executors;Executor;ExecutorService;ScheduledExecutorService; ThreadFactory;Cal

原创 PRC、RMI、SOAP、REST等的區別與聯繫

不同系統之間,總是避免不了要互相通信,通信方式無外乎兩種:方法調用、請求和等待。前者是直接調用對方的API,而後者是通過http請求,告訴對方要執行的方法和參數,並返回結果。 通信方式    --RPC         :它是一種規範,採

原创 hive學習(5)--- Partitions分區的使用(包括動態分區)

下面這個文章很好的講解了Partitions的使用方法 http://www.aahyhaa.com/archives/316 其他參考文章: http://p-x1984.iteye.com/blog/1156408 http://ww

原创 hadoop小象

http://bbs.chinahadoop.cn/portal.php http://www.chinahadoop.cn/  

原创 hadoop、hive、hbase的區別和應用場景

最近開始自學大數據,肯定免不了hadoop、hive、hbase這些東西。 此處把自己對這3個的理解記錄一下:1、hadoop:它是一個分佈式計算+

原创 hive學習(4)--- hql語句生成job(包括mapper和reducer)的規則探索

在hive學習(3)--- 較大數據下的hql執行速度中提到了不同hql會導致不同的執行速度,和不同的job數,同時也會存在不同job中,不同slaver的負載不一致,也就是所謂的數據傾斜,所以在這裏專門探索下hive根據hql生成job

原创 hive學習(1)---導入外部數據到hive的表中,爲學習hql做準備

在學習hive前,首先需要準備一份樣例數據,然後把這個數據加載進hive的對應表中, 這裏我用java寫file的方式創建了3個關於城市天氣情況的數據,每個字段以空格隔開,\r\n換行,例子如下: 2014-05-23|07:33:58

原创 Apache Hadoop YARN – 背景及概述

http://hongweiyi.com/2012/09/apache-hadoop-yarn-background-and-an-overview/ http://blog.csdn.net/yangbutao/article/deta

原创 hadoop2.2.0的基礎上配置hive0.12.0(支持mysql)

前提:已經安裝好了hadoop2.2.0,當然也可以是其他版本的hadoop,作者使用的是這個版本,並在vmware上配了一個master和3個slaver。配置方式參考: http://blog.csdn.net/glgl2424/ar

原创 併發編程網

http://ifeve.com/java-nio-all/ 一個阿里的兄弟創辦的,還不錯

原创 基於hive的日誌數據統計實戰

http://blog.csdn.net/sutine/article/details/5653137

原创 說說大型高併發高負載網站的系統架構

http://blog.csdn.net/sutine/article/details/1864330

原创 Hadoop優秀博客

HBase使用場景和成功案例:http://blog.sina.com.cn/s/blog_ae33b83901016azb.html Hadoop社區:http://hadoop.csdn.net/m/zone/hadoop/blog

原创 hive學習(0)---學習計劃

第一階段:熟悉hive,嘗試調優 ~6.2:熟練掌握hive sql的基本操作,同時尋找適合學習的日誌數據格式(可以從hi3ms找一下) 6.3~6.6:收集調優經驗 6.7~6.20:嘗試各種調優經驗 6.21~6.30:重新學習hdf

原创 hive學習(2)--- hive sql 常用語法

hql語法參考文章:http://blog.csdn.net/acmilanvanbasten/article/details/17252673 一、單表select 1、and、sort by 、limit的使用 hive> sele