原创 利用BulkLoad導入Hbase表
1、插入HBase表傳統方法具有什麼問題? 我們先看下 HBase 的寫流程: 通常 MapReduce 在寫HBase時使用的是TableOutputFormat方式,在map/reduce中直接生成put對象寫入HBase,
原创 sizeof(struct)的結果分析及其原因
一 引入有的時候,在腦海中停頓了很久的“顯而易見”的東西,其實根本上就是錯誤的。就拿下面的問題來看:struct T{char ch;int i ;};使用sizeof(T),將得到什麼樣的答案呢?要是以前,想都不用想,在32位機中,int
原创 我的友情鏈接
51CTO博客開發
原创 jvm垃圾回收機制
jvm的垃圾回收就是對jvm中不用的對象進行釋放,將其所佔的內存進行回收。首先介紹下jvm的內存,jvm的內存結構如下圖所示:JVM 內存包含如下幾個部分:Heap(堆) Memory 存放Java對象Non-Heap Memor
原创 java中斷小記(二)
在上一篇博文中,介紹了成員方法interrupt()的用法,這篇接上上篇繼續介紹剩下的兩個與中斷有關的方法。2.成員方法new Thread().isInterrupted() 通常使用Thread.currentThread
原创 Surus初探
一、概述 Surus是NetFlix開源的UDFs,是基於pig和hive的數據分析工具。解決問題 Surus中的功能能夠解決多種多樣的問題,例如分數預測模型、異常檢測與模式匹配等等,Surus還可以作爲提高大數
原创 Colloction與Map解析
一、概述在JAVA的util包中有兩個所有集合的父接口Collection和Map,它們的父子關係: +Collection 這個接口extends自 --java.lang.Iterable接口 ├+List(接口 代表有序,可重複的集合
原创 sizeof(struct)的結果分析及其原因
一 引入有的時候,在腦海中停頓了很久的“顯而易見”的東西,其實根本上就是錯誤的。就拿下面的問題來看:struct T{char ch;int i ;};使用sizeof(T),將得到什麼樣的答案呢?要是以前,想都不用想,在32位機中,int
原创 利用BulkLoad導入Hbase表
1、插入HBase表傳統方法具有什麼問題? 我們先看下 HBase 的寫流程: 通常 MapReduce 在寫HBase時使用的是TableOutputFormat方式,在map/reduce中直接生成put對象寫入HBase,
原创 java中斷小記(一)
java中與中斷相關的函數有如下三個: 1.通過成員方法Thread.interrupt()來設置中斷狀態爲true 2.通過成員方法Thread.isInterrupted()來獲取中斷狀態 3.通過靜態方法Thread.in
原创 jvm垃圾回收機制
jvm的垃圾回收就是對jvm中不用的對象進行釋放,將其所佔的內存進行回收。首先介紹下jvm的內存,jvm的內存結構如下圖所示:JVM 內存包含如下幾個部分:Heap(堆) Memory 存放Java對象Non-Heap Memor
原创 單例的幾種創建方法
package singleton; /** * @author lei * 單例模式的五種寫法: * 1、懶漢 * 2、餓漢 * 3、靜態內部類 * 4、枚舉 * 5、雙重校驗鎖 * 2011-9-6 */ /**
原创 vs2010導入項目出現未加載問題
昨天幫別人寫了個.net的程序,拷貝到別人電腦時出現錯誤,說有些項目不可用,錯誤提示如下圖。這個程序是我在網上下載的代碼基礎上修改的,自己以前寫的程序沒有出現過這種情況。由錯誤提示發現這個是由於路徑錯誤導致的,然後就在項目裏搜索這個路徑在哪
原创 Stanford Segmenter 中文分詞嘗試
Stanford Segmenter是Stanford大學的一個開源分詞工具,目前已支持漢語和阿拉伯語,只是比較耗費內存,但貌似比中科院的分詞工具快(具體沒測)。 Stanford Segmenter是基於CRF(Condit
原创 java堆棧相關知識
Java棧與堆本博客內容由網上搜集而來,作者加以修改整理而成1. 棧(stack)與堆(heap)都是Java用來在Ram中存放數據的地方。與C++不同,Java自動管理棧和堆程序員不能直接地設置棧或堆。2. 棧的優勢是,存取速度比堆要快