台部落空心DM

1.DataNode工作機制 2.數據完整性（瞭解）思考：如果電腦磁盤裏面存儲的數據是控制高鐵信號燈的紅燈信號（1）和綠燈信號（0），但是存儲該數據的磁盤壞了，一直顯示是綠燈，是否很危險？同理DataNode 節點上的數據損

2020-06-22 10:23:27

1. 概述壓縮概述壓縮策略和原則 2. MR支持的壓縮編碼爲了支持多種壓縮/解壓縮算法，Hadoop 引入了編碼/解碼器，如下表壓縮性能的比較 3.壓縮方式選擇 Gzip壓縮 Bzip2壓縮 Lzo壓縮

2020-06-22 09:57:03

一. HDFS文件上傳需求：把本地d盤上的lol.txt文件上傳到HDFS根目錄二. HDFS文件下載需求：從HDFS上下載banhua.txt文件到本地e盤上三. 定位文件讀取需求：分塊讀取HDFS上的大文件，

2020-06-22 09:57:03

一、啓動HDFS並運行MapReduce程序配置集羣（1）配置：hadoop.env.sh （2）配置 core-site.xml （3）配置 hdfs-site.xml 啓動集羣（1）格式化 NameNo

2020-06-22 09:57:03

1.集羣間數據拷貝 2.小文件存檔 3.回收站開啓回收站功能，可以將刪除的文件在不超時的情況下，恢復原數據，起到防止誤刪除、備份等作用。回收站參數設置及工作機制啓用回收站查看回收站回收站在集羣中的路徑：/u

2020-06-22 09:57:03

配置時間同步具體實操： 1. 時間服務器配置（必須 root用戶）（1）檢查 ntp是否安裝（2）修改 ntp配置文件修改內容如下：（3）修改 /etc/sysconfig/ntpd 文件（4）重新啓動 n

2020-06-22 09:57:03

2020-06-22 09:57:03

（1）根據自己電腦的操作系統拷貝對應的編譯後的 hadoop jar包到非中文路徑（例如 D:\Develop\hadoop-2.7.2）。（2）配置 HADOOP_HOME 環境變量（3）配置 Path環境變量（

2020-06-22 09:57:03

一. HDFS文件上傳編寫源代碼將hdfs-site.xml拷貝到項目的根目錄下參數優先級（1）客戶端代碼中設置的值 >（2）ClassPath下的用戶自定義配置文件 >（3）然後是服務器的默認配置二. HDFS文件

2020-06-22 09:57:03

幾種IO輸入流簡介 FileInputStream ：字節輸入流 FileReader ：字符輸入流 InputStreamReader ：是字節流與字符流之間的橋樑，能將字節流輸出爲字符流，並且能爲字節流指定字符集，可輸出一個

2020-05-24 16:01:39

我們使用關鍵字new創建一個類的對象的時候，這個類可以沒有被加載。但是使用newInstance()方法的時候，就必須保證這個類已經加載並且已經連接了。降低耦合度： newInstance()實際上是把new這個方式分解爲兩步

2020-05-24 16:01:39

random.nextInt()是java.util.Random類中的方法 Math.random()是java.lang.Math類中的靜態方法 Math.random()：生成一個浮點型僞隨機數字,在0(包括0)和1(不包

2020-05-24 16:01:39

一. SimpleDateFormate的兩個方法：parse(),format()； parse()：將String的對象根據模板提供的yyyy-mm-dd進行轉化成爲Date類型，如果String的對象不是指定的模板類型的

2020-05-24 16:01:39

1. 概述在java.io.包下 InputStream，outputStream, Reader, Writer 等基類都實現了Closeable接口，因爲每次的IO操作結束之後都要去釋放資源。 Closeable 是可以關閉

2020-05-24 16:01:39

第一步：查找域名對應的IP地址主機查找：瀏覽器緩存 => 系統緩存 => 路由器緩存（遞歸查詢）本地域名服務器以DNS客戶身份查詢（迭代查詢）依次訪問根域名服務器、頂級域名服務器、域名服務器第二步：三次握手建立TCP連

2020-04-16 04:13:50