台部落芝麻水煮西瓜

原创 Linux四劍客之grep

grep 一、基礎操作 0）過濾查找，匹配文件裏面的某個字符、內容 1）查找文件裏面的某個內容 grep "root" /

2020-06-23 01:05:18

原创大數據開發之flume安裝

下載需要的版本並且上傳到centos 這裏我下載的是flume1.7.0，地址：http://www.apache.org/dyn/closer.lua/flume/1.7.0/apache-flume-1.7.0-bin.tar.gz

2020-06-23 00:18:11

原创大數據開發之spark基礎

spark 一、產生背景迭代式計算交互式數據挖掘二、安裝部署 1、下載安裝包 2、上傳到linux

2020-06-23 00:17:59

原创大數據開發之MapReduce常用的調優參數

一、資源相關參數 1）以下參數是在用戶自己的mr應用程序中配置就可以生效（mapred-default.xml）配置參數參數說明 mapreduce.map.memory.mb 一個Map Task可使用的資源上限（單

2020-06-23 00:17:58

原创大數據開發之kafka基礎知識點

kafka 一、理性認知在流式計算中，kafka一般用來緩存數據，Storm通過消費kafka的數據進行計算 1、Apache kafka是一個開源消息系統，由Scala寫成。是由Apache軟件基金會

2020-06-23 00:17:58

原创大數據開發之zookeeper集羣搭建

一、下載zookeeper 直接搜需要的版本進行下載，這裏我下載的是3.4.10版本的二、將壓縮包上傳到centos之上三、解壓 [root@hlh003 software]# tar -zxvf zookeeper-

2020-06-23 00:17:58

原创大數據開發之storm基礎知識點

storm 一、概述離線計算批量獲取數據、批量傳輸數據、週期性批量計算數據、數據展示代表技術

2020-06-23 00:17:58

原创大數據開發之hadoop HA配置

hadoop HA 一、原理 HA高可用存儲當editlog發生變化時，則直接寫入JournalNode，以用來分享給其他的NameNode 二、安裝部署 step1、配置z

2020-06-23 00:17:58

原创大數據之安裝hive

一、按照自己的需要去下載相應的版本並傳到centos中 https://archive.apache.org/dist/hive/hive-1.2.1/ 二、解壓並改名 [root@hlh003 software]# tar -z

2020-06-23 00:17:58

原创大數據開發之kafka安裝

安裝kafka前需要安裝zookeeper，參考https://blog.csdn.net/weixin_44772799/article/details/99545064 一、按需求下載kafka並傳到centos 二、解壓安

2020-06-23 00:17:58

原创大數據開發之zookeeper知識點總結

ZOOKEEPER 一、概述是一個開源的分佈式的，爲分佈式應用提供協調服務的Apache項目基於觀察者模式設計的分佈式服務管理框架，它負責存儲和管理大家都關心的數據，然

2020-06-23 00:17:58

原创完整elasticsearch安裝及其插件安裝

一、elasticsearch安裝 1、官網下載安裝包並上傳並解壓 2、es下建立data和logs目錄 3、編輯conf/elasticsearch.yml文件 cluster：cluster.name:hlh-app

2020-06-23 00:17:58

1

原创 Linux四劍客之grep

原创大數據開發之flume安裝

原创大數據開發之spark基礎

原创大數據開發之MapReduce常用的調優參數

原创大數據開發之kafka基礎知識點

原创大數據開發之zookeeper集羣搭建

原创大數據開發之storm基礎知識點

原创大數據開發之hadoop HA配置

原创大數據之安裝hive

原创大數據開發之kafka安裝

原创大數據開發之zookeeper知識點總結

原创完整elasticsearch安裝及其插件安裝

原创大數據開發之kafka配置信息

原创大數據開發之JVM基礎知識點

原创大數據開發之hive知識點總結