原创 hadoop 控制map任務數詳解

但是通過這種方式設置map的個數,並不是每次都有效的。原因是mapred.map.tasks只是一個hadoop的參考數值,最終map的個數,還取決於其他的因素。 爲了方便介紹,先來看幾個名詞: block_size : hdfs的文件塊

原创 騰訊壟斷高院公審 360呼籲:不要讓壟斷扼殺創業者的中國夢

騰訊壟斷高院公審 360呼籲:不要讓壟斷扼殺創業者的中國夢 科學中國-中國網 science.china.com.cn  時間: 2013-11-26  責任編輯: 海峯 11月26日上午9時,有中國“互聯網反壟斷第一案”之稱

原创 wget 命令用法詳解

wget是在Linux下開發的開放源代碼的軟件,作者是Hrvoje Niksic,後來被移植到包括Windows在內的各個平臺上。它有以下功能和特點: (1)支持斷點下傳功能;這一點,也是網絡螞蟻和FlashGet當年最大的賣點,現在,

原创 解決 Agent admitted failure to sign using the key 問題 with ssh

之前如果建立 ssh 連接, 只要將公鑰複製到 ~/.ssh/authorized_keys 就可以利用金鑰登入 而不需要建立密碼. 現在的 ssh 使用同樣的方法會出現錯誤訊息 Agent admitted failure to s

原创 Hadoop 新 MapReduce 框架 Yarn 詳解

http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/

原创 C#操作Word

    近期因爲項目需要,寫了許多word2003編程的東東.有時候遇到難題想查sdk說明,很難找到中文解釋,對於e文不好的我來說,簡直是天書.想必很多人多有感慨.     下面列出內容是一些常用的內容說明,希望對大家有幫助.     那

原创 Fork and Join: Java也可以輕鬆地編寫併發程序

牛逼的文章,看人家寫的代碼好羨慕啊!!!!!Fork and Join: Java也可以輕鬆地編寫併發程序 原文地址   作者:Julien Ponge 譯者:iDestiny 翻譯地址 資源下載: Java SE 7 S

原创 java枚舉類型詳解

1. 枚舉類型   1.1枚舉類型簡介   J2SE 5.0 以及之前的JDK有兩種基本方法可以來定義新類型:通過Classes 以及Interface. 對於大部分面向對象編程來說,這兩種方法看起來似乎足夠了.但是在一些特殊情況下

原创 Impala1.2.4安裝配置詳解

1、  安全性考慮,我們使用hive用到的賬戶cup進行impala的啓停等操作,而不另外使用impala賬戶;這涉及到後文中的一些文件夾權限調整、配置文件中的用戶參數調整; 2、  性能考慮,impala-state-store、i

原创 hadoop 0.20.2 多文件輸出

看了網上的很多文章,還是這個最靠譜 inkfish原創,請勿商業性質轉載,轉載請註明來源(http://blog.csdn.net/inkfish )。   Hadoop默認的輸出是TextOutputFormat,輸出文件名

原创 mapreduce程序中讀取文件過程詳解

hadoop的inputformat包括他的子類reader是maptask讀取數據的重要步驟 一、獲得splits-mapper數 1. jobclinet的submitJobInternal,生成split,獲取mapper數量

原创 linux安裝Mysql

Redhat 5 下安裝Mysql 1.下載Server和client Server: Java代碼   wget http://mysql.easynet.be/Downloads/MySQL-5.5/MySQL-server

原创 Hadoop2.0 端口

查看HDFS:    http://16.187.94.161:50070 查看RM:    http:// 16.187.94.161:8088

原创 Caused by: org.datanucleus.store.rdbms.exceptions.MissingTableException: Required table m

最近需要提取一些數據,故開始使用hive,本機搭建了一個hive客戶端環境,但是始終有問題,在本機裝好了mysql以後,老是報     Java代碼   Caused by: org.datanucleus.store.rd

原创 hadoop如何自定義InputFormats和OutputFormats

Data Mining,NLP,Search Engine Hadoop的InputFormats和OutputFormats InputFormat InputFormat類用來產生InputSplit,並把它切分成reco