原创 hive sql 用法

  DDL Operations 創建表 hive> CREATE TABLE pokes (foo INT, bar STRING); 創建

原创 Hive UDF 開發

   轉自 http://richiehu.blog.51cto.com/2093113/386112     Hive進行UDF開發十分簡

原创 深入剖析Hadoop程序日誌

深入剖析Hadoop程序日誌    前提 本文來自於 博客園 逖靖寒的世界 http://gpcuster.cnblogs.com 瞭解log4j的使用。  正文 本文來自於 博客園 逖靖寒的世界 http://gpcuster.

原创 hadoop 兩表join處理方法

 1. 概述 在傳統數據庫(如:MYSQL)中,JOIN操作是非常常見且非常耗時的。而在HADOOP中進行JOIN操作,同樣常見且耗時,由於Hado

原创 HBase 集羣配置

  HBase 是一個開源的非關係(NoSQL)的可伸縮性分佈式數據庫。它是面向列的,並適合於存儲超大型鬆散數據。HBase適合於實時,隨機對Big

原创 Hive UDAF 開發

  本文轉自:http://richiehu.blog.51cto.com/2093113/386113 Hive進行UDAF開發,相對要比UD

原创 hadoop IPC/RPC 機制

  在分佈式應用程序中使用Hadoop IPC/RPC 原文地址:http://www.supermind.org/blog/520/using-

原创 基於mapreduce的 Hadoop join 實現分析(二)

  基於mapreduce的Hadoop join實現分析(二) 標籤: hadoop mapreduce join 2009-11-2

原创 Hive 的可拓展性

 文章轉自: http://www.chinaovo.net/hive/295.htm   Hive 是一個很開放的系統,很多內容都支持用戶定製,包括: 文件格式:Text File,Sequence File內存中的數據格式: Jav

原创 開源日誌系統

   轉自 http://dongxicheng.org/search-engine/log-systems/ 開源日誌系統比較    1.

原创 基於mapreduce的Hadoop join實現分析(一)

基於mapreduce的Hadoop join實現分析(一)   對於一個大數據的分析應用,join是必不可少的一項功能.現在很多構建與hadoop之上的應用,如Hive,PIG等在其內部實現了join程序,可以通過很簡單的sq

原创 hbase 架構

  [翻譯]HbaseArchitecture HBase架構 原文地址:http://wiki.apache.org/hadoop/Hbas

原创 python常用時間操作

  python常用時間操作 分類: Python 2010-08-30 10:07 146人閱讀 評論(0) 收藏 舉報 我們先導入必

原创 RHEL/CentOS 5.x使用yum快速安裝MySQL 5.5.x

  RHEL/CentOS 5.x使用yum快速安裝MySQL 5.5.x 1、安裝MySQL 5.5.x的yum源:rpm -Uvh htt

原创 hadoop 併發編程

轉自 http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop2/index.ht