原创 使用JSP讀取TXT格式文件

創建txtRead.jsp<%@ page language="java" contentType="text/html; charset=gb2312"    pageEncoding="gb2312"%>    <%@  page im

原创 R刪除向量或data.frame中的缺失值NA

A<-na.omit(A)A可以是vector(list),data frame或matrix。如果A是data frame或matrix,則同一行如果有一個NA,這一行都會被刪除。

原创 我的友情鏈接

51CTO博客開發

原创 詳細 完整分佈模式安裝hadoop VirtualBox 3虛擬機

詳細 完整分佈模式安裝hadoop VirtualBox 3虛擬機基礎設備宿主機器:CPU:Intel&reg; Core i5-2400 CPU @ 3.10GHz內存:4G硬盤:500G操作系統:Win7 32BitLinux 版本:C

原创 eclipse.ini參數

       JVM有堆內存(Heap)和非堆內存(Non Heap)。       堆內存在JVM啓動時分配,主要用來存放用戶實例和數組等用戶數據,即用戶可操作內存。       非堆內存用戶不可訪問,主要用來存放類方法、結構和一些JVM

原创 解決分表後聯合查詢

解決分表後聯合查詢  MERGE存儲引擎,也被認識爲MRG_MyISAM引擎,是一個相同的可以被當作一個來用的MyISAM表的集合。“相同”意味着所有表同樣的列和索引信息。你不能合併列被以不同順序列於其中的表,沒有恰好同樣列的表,或有不同順

原创 mysql分表的3種方法

mysql分表的3種方法一,先說一下爲什麼要分表當一張的數據達到幾百萬時,你查詢一次所花的時間會變多,如果有聯合查詢的話,我想有可能會死在那兒了。分表的目的就在於此,減小數據庫的負擔,縮短查詢時間。根據個人經驗,mysql執行一個sql的過

原创 eclipse hadoop開發環境配置

win7下安裝hadoop完成後,接下來就是eclipse hadoop開發環境配置了。具體的操作如下:一、在eclipse下安裝開發hadoop程序的插件安裝這個插件很簡單,haoop-0.20.2自帶一個eclipse的插件,在hado

原创 linux常用命令大全(轉)

linux常用命令大全(轉) 由於記憶力有限,把平時常用的Linux命令整理出來,以便隨時查閱: linux 基本命令 ls     (list 顯示當前目錄下文件和目錄 ls -l 詳細顯示 =ll ) [root@linux ~]#

原创 用Hadoop構建電影推薦系統

用Hadoop構建電影推薦系統轉自:http://blog.fens.me/hadoop-mapreduce-recommend/Hadoop家族系列文章,主要介紹Hadoop家族產品,常用的項目包括Hadoop, Hive, Pig, H

原创 Windows平臺下安裝Hadoop

Windows平臺下安裝Hadoop 1、安裝JDK1.6或更高版本  官網下載JDK,安裝時注意,最好不要安裝到帶有空格的路徑名下,例如:Programe Files,否則在配置Hadoop的配置文件時會找不到JDK(按相關說法,配置文件

原创 Ubuntu的一些常用快捷鍵

           Ubuntu的一些常用快捷鍵            Ubuntu操作基本快捷鍵* 打開主菜單 = Alt + F1* 運行 = Alt + F2* 顯示桌面 = Ctrl + Alt + d* 最小化當前窗

原创 基於Eclipse的Hadoop應用開發環境配置

基於Eclipse的Hadoop應用開發環境配置 我的開發環境:操作系統centos5.5 一個namenode 兩個datanodeHadoop版本:hadoop-0.20.203.0Eclipse版本:eclipse-java-he

原创 mahout安裝

 mahout安裝分類: hadoop/hive datamining2012-11-19 11:43 385人閱讀 評論(0) 收藏 舉報mahout是hadoop的一種高級應用。運行mahout需要提前安裝好hadoop。hadoop的

原创 hadoop2.2.0源代碼編譯

hadoop2.2.0源代碼編譯      一、環境說明虛擬軟件:VMware Workstation 10虛擬機配置:RHEL Server release 6.5 (Santiago) 2.6.32-431.el6.x86_64c