因公司開發需求,需要對產品的數據進行運營分析,目前已有技術棧不能支撐現有的需求,需要學習新的技術,前期調研需求後選定的框架爲大數據框架,主要使用hadoop+flume+log4j進行大數據的日誌處理.
前期準備:
開發環境:ubuntu 18.4
hadoop環境搭建
hadoop:是由Apache基金會所開發的分佈式系統基礎架構
我使用的版本是3.2.1
我本地搭建的是單節點集羣,多節下次再嘗試
這裏記錄我的環境搭建安裝步驟
準備步驟
-
我現在網上查詢了很多環境部署教程都說要創建一個有root權限的賬號hadoop,雖然不知道爲什麼要創建,但還是跟着創建了一個賬戶.
-
需要java環境,本機已經有,且前博客也有寫java環境的搭建,就不重複寫了
-
解壓下載的包到/urs/local/hadoop路徑下
-配置java環境到hadoop的環境配置hadoop-env.sh文件中,如下圖
-修改文件的擁有者sudo chmod -R hadoop:hadoop hadoop/