hadoop hdfs的api簡單使用

本篇介紹myeclipse下測試hdfs的操作,本篇是在另一篇博文hadoop ha 高可用搭建的基礎上搭建的。

目錄

一、windows下環境配置

二、location 連接測試

三、hadoop hdfs api 測試


一、windows下環境配置

1)創建hadoop_home文件夾,在此爲D:\Program Files\Hadoop;

2)將hadoop-2.6.5.tar.gz、hadoop-2.6.5-src.tar.gz、hadoop-eclipse-plugin-2.6.0.jar,複製到該文件夾中;

3)將hadoop-2.6.5.tar.gz、hadoop-2.6.5-src.tar.gz解壓到當前目錄;

4)在該文件夾中新建hadoop-lib空文件夾;

5)將D:\Program Files\Hadoop\hadoop-2.6.5\share\hadoop\[common/hdfs/mapreduce/tools/yarn]\下的jar包和D:\Program Files\Hadoop\hadoop-2.6.5\share\hadoop\[common/hdfs/mapreduce/tools/yarn]\lib\下的jar包複製到hadoop-lib文件夾中(可覆蓋,共121個);

 完成後如圖所示:

6)將視頻資料中tool/bin中的全部文件覆蓋到D:\Program Files\Hadoop\hadoop-2.6.5\bin中;

視頻資料tool/bin文件如圖所示:

7)將D:\Program Files\Hadoop\hadoop-2.6.5\bin中hadoop.dll複製到C:\Windows\System32中,重啓電腦;

8)創建環境變量HADOOP_HOME、HADOOP_USER_NAME,並在path變量中添加HADOOP_HOME/bin,如下圖所示:

9)將D:\Program Files\Hadoop\hadoop-eclipse-plugin-2.6.0.jar複製到myeclipse中的plugins文件夾中,在此爲D:\Program Files (x86)\MyEclipse Professional 2014\plugins;

10)按如下步驟在myeclipse中添加插件;

11)在myeclipse中添加hadoop部署路徑,按下圖所示:

二、location 連接測試

1)新建location連接;

2)在test中新建文件夾 

新建

3)在瀏覽器中可以看到新建的文件夾

三、hadoop hdfs api 測試

1 導入hadoop librarys

2 創建java項目

3 導入hadoop librarys和JUnit測試

4 導入hadoop 配置文件

5 新建java類

編輯java文件如下:

package com.dxw.hadoop.hdfs;

import java.io.BufferedInputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.BlockLocation;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;
import org.junit.After;
import org.junit.Before;
import org.junit.Test;

public class TestHDFS {
	
	Configuration conf;
	FileSystem fs;

	@Before
	public void conn() throws Exception{
		
		conf = new Configuration(true);
		
		fs = FileSystem.get(conf);
	}
	
	@After
	public void close() throws Exception{
		fs.close();
	}
	
	@Test
	public void mkdir() throws Exception{  //在hdfs上創建文件夾/ooxx
		
		Path ifile = new Path("/ooxx");
		if(fs.exists(ifile)){
			fs.delete(ifile,true);
		}
		fs.mkdirs(ifile);
	}
	
	@Test
	public void upload() throws Exception{ //將c盤下的hello文件上傳到集羣中的/ooxx/hello.txt中
		
		Path f = new Path("/ooxx/hello.txt");
		FSDataOutputStream output = fs.create(f);

		InputStream input = new BufferedInputStream(new FileInputStream(new File("C:\\hello")));
		
		IOUtils.copyBytes(input,output,conf,true);
	}
	
	@Test
	public void blks() throws Exception{ //將zookeeper-3.4.6.tar.gz上傳到hdfs中,用該方法讀取塊
		
		Path i = new Path("/user/root/zookeeper-3.4.6.tar.gz");
		FileStatus ifile = fs.getFileStatus(i);
		BlockLocation[] blks = fs.getFileBlockLocations(ifile, 0, ifile.getLen());
		
		for (BlockLocation b : blks){
			System.out.println(b);
		}
	}
}

6 測試

執行後會在hdfs中創建文件夾和創建文件hello.txt,效果如下

先用下面命令上傳文件,然後執行java方法,可以看到塊的信息。

 hdfs dfs -mkdir -p /user/root    # hdfs上創建目錄
hdfs dfs -D dfs.blocksize=1048576 -put zookeeper-3.4.6.tar.gz   # 將文件上傳到hdfs

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章