原创 第三方jar包引入項目工程方法

方法一: 再idea中直接用maven引入 命令如下: mvn install:install-file -Dfile=G:\code\bd\branches\bigdata-project-zuoke\app-logs-spark\s

原创 數據預處理與特徵工程

數據預處理與特徵工程 缺失值處理 缺失值處理通常有如下的方法: 對於unknown值數量較少的變量,包括job和marital,刪除這些變量是缺失值(unknown)的行; 如果預計該變量對於學習模型效果影響不大,可以對unknow

原创 log4j發送日誌給flume,並通過過濾器,將日誌存入hdfs中,通過日期分區存放

一、log4j配置文件修改需要在發送端引入依賴包 <dependency> <groupId>org.apache.flume.flume-ng-clients</groupId> <artifactId>flume-n

原创 在linux安裝nodejs,配置好環境變量後,node -v出錯: bash: /usr/local/node/bin/node: /lib/ld-linux.so.2: bad ELF inte

在linux安裝nodejs,配置好環境變量後,node -v出錯: bash: /usr/local/node/bin/node: /lib/ld-linux.so.2: bad ELF interpreter: 沒有那個文件或目錄 按