原创 利用BulkLoad導入Hbase表

1、插入HBase表傳統方法具有什麼問題? 我們先看下 HBase 的寫流程:     通常 MapReduce 在寫HBase時使用的是TableOutputFormat方式,在map/reduce中直接生成put對象寫入HBase,

原创 sizeof(struct)的結果分析及其原因

一 引入有的時候,在腦海中停頓了很久的“顯而易見”的東西,其實根本上就是錯誤的。就拿下面的問題來看:struct T{char ch;int i ;};使用sizeof(T),將得到什麼樣的答案呢?要是以前,想都不用想,在32位機中,int

原创 我的友情鏈接

51CTO博客開發

原创 jvm垃圾回收機制

     jvm的垃圾回收就是對jvm中不用的對象進行釋放,將其所佔的內存進行回收。首先介紹下jvm的內存,jvm的內存結構如下圖所示:JVM 內存包含如下幾個部分:Heap(堆) Memory 存放Java對象Non-Heap Memor

原创 java中斷小記(二)

    在上一篇博文中,介紹了成員方法interrupt()的用法,這篇接上上篇繼續介紹剩下的兩個與中斷有關的方法。2.成員方法new Thread().isInterrupted()    通常使用Thread.currentThread

原创 Surus初探

一、概述       Surus是NetFlix開源的UDFs,是基於pig和hive的數據分析工具。解決問題         Surus中的功能能夠解決多種多樣的問題,例如分數預測模型、異常檢測與模式匹配等等,Surus還可以作爲提高大數

原创 Colloction與Map解析

一、概述在JAVA的util包中有兩個所有集合的父接口Collection和Map,它們的父子關係: +Collection 這個接口extends自 --java.lang.Iterable接口 ├+List(接口 代表有序,可重複的集合

原创 sizeof(struct)的結果分析及其原因

一 引入有的時候,在腦海中停頓了很久的“顯而易見”的東西,其實根本上就是錯誤的。就拿下面的問題來看:struct T{char ch;int i ;};使用sizeof(T),將得到什麼樣的答案呢?要是以前,想都不用想,在32位機中,int

原创 利用BulkLoad導入Hbase表

1、插入HBase表傳統方法具有什麼問題? 我們先看下 HBase 的寫流程:     通常 MapReduce 在寫HBase時使用的是TableOutputFormat方式,在map/reduce中直接生成put對象寫入HBase,

原创 java中斷小記(一)

java中與中斷相關的函數有如下三個:   1.通過成員方法Thread.interrupt()來設置中斷狀態爲true   2.通過成員方法Thread.isInterrupted()來獲取中斷狀態   3.通過靜態方法Thread.in

原创 jvm垃圾回收機制

     jvm的垃圾回收就是對jvm中不用的對象進行釋放,將其所佔的內存進行回收。首先介紹下jvm的內存,jvm的內存結構如下圖所示:JVM 內存包含如下幾個部分:Heap(堆) Memory 存放Java對象Non-Heap Memor

原创 單例的幾種創建方法

package singleton;   /**  * @author lei  * 單例模式的五種寫法:  * 1、懶漢  * 2、餓漢  * 3、靜態內部類  * 4、枚舉  * 5、雙重校驗鎖  * 2011-9-6  */ /**

原创 vs2010導入項目出現未加載問題

昨天幫別人寫了個.net的程序,拷貝到別人電腦時出現錯誤,說有些項目不可用,錯誤提示如下圖。這個程序是我在網上下載的代碼基礎上修改的,自己以前寫的程序沒有出現過這種情況。由錯誤提示發現這個是由於路徑錯誤導致的,然後就在項目裏搜索這個路徑在哪

原创 Stanford Segmenter 中文分詞嘗試

    Stanford Segmenter是Stanford大學的一個開源分詞工具,目前已支持漢語和阿拉伯語,只是比較耗費內存,但貌似比中科院的分詞工具快(具體沒測)。    Stanford Segmenter是基於CRF(Condit

原创 java堆棧相關知識

Java棧與堆本博客內容由網上搜集而來,作者加以修改整理而成1. 棧(stack)與堆(heap)都是Java用來在Ram中存放數據的地方。與C++不同,Java自動管理棧和堆程序員不能直接地設置棧或堆。2. 棧的優勢是,存取速度比堆要快