原创 Hadoop安裝

環境 ubuntu18 + hadoop2.7.7 + jdk1.8 準備 版本選擇 根據Hadoop HBase JAVA版本兼容情況, 推薦安裝 Hadoop-2.7.1+ 與 Java1.8 安裝java, 並添加環境變量

原创 Hadoop單機模式安裝

Hadoop單機模式安裝 一、實驗介紹 1.1 實驗內容 hadoop三種安裝模式介紹 hadoop單機模式安裝 測試安裝 1.2 實驗知識點 下載解壓/環境變量配置 Linux/shell 測試WordCount程序 1.3 實驗環境

原创 HTTP首部字段

HTTP首部字段 HTTP首部字段根據實際用途被分爲以下4種類型: 1、通用首部字段 請求報文和響應報文兩方都會使用的首部。 2、請求首部字段 從客戶端向服務器端發送請求報文時使用的首部。補充了請求的附加內容、客戶端信息、響應內容相關優先

原创 python爬蟲常用第三方庫

python爬蟲常用第三方庫 這個列表包含與網頁抓取和數據處理的Python庫 網絡 通用 urllib -網絡庫(stdlib)。 requests -網絡庫。 grab – 網絡庫(基於pycurl)。 pycurl – 網絡庫(綁

原创 賺積分的方法

 一篇原創博客可以賺10積分.

原创 文件系統與數據庫系統的區別和聯繫

區別:1.文件系統將數據以文件的方式存儲在外存上,而數據庫系統將數據統一用數據庫進行存儲。2.文件系統是面向(單個或一組)應用的,當不同程序調用同一文件時必須新建一個對應自身的文件,造成數據冗餘度大。數據庫系統是面向數據的,在數據庫系統中

原创 關於數據總線,地址總線,控制總線,操作系統位數對尋址範圍的影響及32位系統爲什麼可尋址範圍爲4G的解答

首先明確 數據總線,地址總線,控制總線的區別 及 操作系統位數對尋址範圍的影響.    1.數據總線,地址總線,控制總線的區別    比如一封信到你家門口,郵遞員會大喊一聲:“信來了”。在計算機內部數據在數據總線上傳遞的,每條傳輸線我們稱