Java IO的RandomAccessFile的使用

轉:http://blog.csdn.net/czplplp_900725/article/details/37809579

現有如下的一個需求,向已存在1G數據的txt文本里末尾追加一行文字,內容如下“Lucene是一款非常優秀的全文檢索庫”。可能大多數朋友會覺得這個需求很easy,說實話,確實easy,然後XXX君開始實現了,直接使用Java中的流讀取了txt文本里原來所有的數據轉成字符串後,然後拼接了“Lucene是一款非常優秀的全文檢索庫”,又寫回文本里了,至此,大功告成。後來需求改了,向5G數據的txt文本里追加了,結果XXX君傻了,他內存只有4G,如果強制讀取所有的數據並追加,會報內存溢出的異常。

其實上面的需求很簡單,如果我們使用JAVA IO體系中的RandomAccessFile類來完成的話,可以實現零內存追加。其實這就是支持任意位置讀寫類的強大之處。



在這之前,散仙還是喜歡先囉嗦的介紹下RandomAccessFile這個類,RandomAccessFile是Java中輸入,輸出流體系中功能最豐富的文件內容訪問類,它提供很多方法來操作文件,包括讀寫支持,與普通的IO流相比,它最大的特別之處就是支持任意訪問的方式,程序可以直接跳到任意地方來讀寫數據。

如果我們只希望訪問文件的部分內容,而不是把文件從頭讀到尾,使用RandomAccessFile將會帶來更簡潔的代碼以及更好的性能。


下面來看下RandomAccessFile類中比較重要的2個方法,其他的和普通IO類似,在這裏,就不詳細說明了。

方法名 作用
getFilePointer() 返回文件記錄指針的當前位置
seek(long pos) 將文件記錄指針定位到pos的位置



下面散仙給出示例,分析下怎麼使用RandomAccessFile
首先,我們先看下散仙要操作的文本文件的內容截圖。



功能one,讀取任意位置的數據,代碼如下
Java代碼  收藏代碼
  1. /** 
  2.      * 讀的方法 
  3.      * @param path 文件路徑 
  4.      * @param pointe 指針位置 
  5.      * **/  
  6.     public static void randomRed(String path,int pointe){  
  7.         try{  
  8.             //RandomAccessFile raf=new RandomAccessFile(new File("D:\\3\\test.txt"), "r");  
  9.             /** 
  10.              * model各個參數詳解 
  11.              * r 代表以只讀方式打開指定文件 
  12.              * rw 以讀寫方式打開指定文件 
  13.              * rws 讀寫方式打開,並對內容或元數據都同步寫入底層存儲設備 
  14.              * rwd 讀寫方式打開,對文件內容的更新同步更新至底層存儲設備 
  15.              *  
  16.              * **/  
  17.             RandomAccessFile raf=new RandomAccessFile(path, "r");  
  18.             //獲取RandomAccessFile對象文件指針的位置,初始位置是0  
  19.             System.out.println("RandomAccessFile文件指針的初始位置:"+raf.getFilePointer());  
  20.             raf.seek(pointe);//移動文件指針位置  
  21.             byte[]  buff=new byte[1024];  
  22.             //用於保存實際讀取的字節數  
  23.             int hasRead=0;  
  24.             //循環讀取  
  25.             while((hasRead=raf.read(buff))>0){  
  26.                 //打印讀取的內容,並將字節轉爲字符串輸入  
  27.                 System.out.println(new String(buff,0,hasRead));  
  28.                   
  29.             }  
  30.               
  31.               
  32.               
  33.         }catch(Exception e){  
  34.             e.printStackTrace();  
  35.         }  
  36.           
  37.           
  38.           
  39.     }  


測試代碼
Java代碼  收藏代碼
  1. public static void main(String[] args) {  
  2.     String path="D:\\3\\test.txt";         
  3.      int seekPointer=20;  
  4.      randomRed(path,seekPointer);//讀取的方法   
  5.     //randomWrite(path);//追加寫的方法  
  6.     //insert(path, 33, "\nlucene是一個優秀的全文檢索庫");  
  7. }  

運行效果:
Java代碼  收藏代碼
  1. RandomAccessFile文件指針的初始位置:0  
  2. is a teacher  
  3. hadoop is perfect  

功能two,追加數據,代碼如下
Java代碼  收藏代碼
  1. /** 
  2.  * 追加方式 
  3.  * 寫的方法 
  4.  * @param path 文件路徑 
  5.  * ***/  
  6. public static void randomWrite(String path){  
  7.     try{  
  8.         /**以讀寫的方式建立一個RandomAccessFile對象**/  
  9.         RandomAccessFile raf=new RandomAccessFile(path, "rw");  
  10.           
  11.         //將記錄指針移動到文件最後  
  12.         raf.seek(raf.length());  
  13.         raf.write("我是追加的 \r\n".getBytes());  
  14.           
  15.     }catch(Exception e){  
  16.         e.printStackTrace();  
  17.     }  
  18.       
  19. }  

測試代碼
Java代碼  收藏代碼
  1. public static void main(String[] args) {  
  2.     String path="D:\\3\\test.txt";         
  3.      //int seekPointer=20;  
  4.     // randomRed(path,seekPointer);//讀取的方法   
  5.      randomWrite(path);//追加寫的方法  
  6.     //insert(path, 33, "\nlucene是一個優秀的全文檢索庫");  
  7. }  

運行效果:


功能three,任意位置插入數據,代碼如下
Java代碼  收藏代碼
  1. /** 
  2.      * 實現向指定位置 
  3.      * 插入數據 
  4.      * @param fileName 文件名 
  5.      * @param points 指針位置 
  6.      * @param insertContent 插入內容 
  7.      * **/  
  8.     public static void insert(String fileName,long points,String insertContent){  
  9.         try{  
  10.         File tmp=File.createTempFile("tmp"null);  
  11.         tmp.deleteOnExit();//在JVM退出時刪除  
  12.           
  13.         RandomAccessFile raf=new RandomAccessFile(fileName, "rw");  
  14.         //創建一個臨時文件夾來保存插入點後的數據  
  15.         FileOutputStream tmpOut=new FileOutputStream(tmp);  
  16.         FileInputStream tmpIn=new FileInputStream(tmp);  
  17.         raf.seek(points);  
  18.         /**將插入點後的內容讀入臨時文件夾**/  
  19.           
  20.         byte [] buff=new byte[1024];  
  21.         //用於保存臨時讀取的字節數  
  22.         int hasRead=0;  
  23.         //循環讀取插入點後的內容  
  24.         while((hasRead=raf.read(buff))>0){  
  25.             // 將讀取的數據寫入臨時文件中  
  26.             tmpOut.write(buff, 0, hasRead);  
  27.         }  
  28.           
  29.         //插入需要指定添加的數據  
  30.         raf.seek(points);//返回原來的插入處  
  31.         //追加需要追加的內容  
  32.         raf.write(insertContent.getBytes());  
  33.         //最後追加臨時文件中的內容  
  34.         while((hasRead=tmpIn.read(buff))>0){  
  35.             raf.write(buff,0,hasRead);  
  36.         }  
  37.         }catch(Exception e){  
  38.             e.printStackTrace();  
  39.         }  
  40.     }  

測試代碼
Java代碼  收藏代碼
  1. public static void main(String[] args) {  
  2.         String path="D:\\3\\test.txt";         
  3.          //int seekPointer=20;  
  4.         // randomRed(path,seekPointer);//讀取的方法   
  5.         // randomWrite(path);//追加寫的方法  
  6.          insert(path, 33"\nlucene是一個優秀的全文檢索庫");  
  7.     }  

運行效果:



至此,RandomAccessFile類的幾個功能,散仙在代碼中已給出實現了,現在回到本文開始前的提的那個需求,用RandomAccessFile類就可以輕而易舉的完成了,另外需要注意的是,向指定位置插入數據,是散仙自己改造的功能,RandomAccessFile並不直接支持,需要新建一個緩衝區臨時空間,存數據,然後在寫,因爲一旦數據量上了級別,在任意位置插入數據,是很耗內存的,這個也就是爲什麼hadoop的HDFS文件系統,只支持append的方式,而沒有提供修改的操作。


另外我們可以用RandomAccessFile這個類,來實現一個多線程斷點下載的功能,用過下載工具的朋友們都知道,下載前都會建立兩個臨時文件,一個是與被下載文件大小相同的空文件,另一個是記錄文件指針的位置文件,每次暫停的時候,都會保存上一次的指針,然後斷點下載的時候,會繼續從上一次的地方下載,從而實現斷點下載或上傳的功能,有興趣的朋友們可以自己實現下。

發佈了0 篇原創文章 · 獲贊 126 · 訪問量 92萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章