因公司开发需求,需要对产品的数据进行运营分析,目前已有技术栈不能支撑现有的需求,需要学习新的技术,前期调研需求后选定的框架为大数据框架,主要使用hadoop+flume+log4j进行大数据的日志处理.
前期准备:
开发环境:ubuntu 18.4
hadoop环境搭建
hadoop:是由Apache基金会所开发的分布式系统基础架构
我使用的版本是3.2.1
我本地搭建的是单节点集群,多节下次再尝试
这里记录我的环境搭建安装步骤
准备步骤
-
我现在网上查询了很多环境部署教程都说要创建一个有root权限的账号hadoop,虽然不知道为什么要创建,但还是跟着创建了一个账户.
-
需要java环境,本机已经有,且前博客也有写java环境的搭建,就不重复写了
-
解压下载的包到/urs/local/hadoop路径下
-配置java环境到hadoop的环境配置hadoop-env.sh文件中,如下图
-修改文件的拥有者sudo chmod -R hadoop:hadoop hadoop/