台部落奇允

cloudera manager和cdh離線安裝前言之前使用apache hadoop版本安裝部署集羣，需要自己控制各個組件版本，以及添加節點和服務要花很多時間，所以使用cloudera來進行安裝和管理，以及後期方便維護與升

2020-06-24 08:22:04

安裝python第三方庫一般使用工具easy_install和pip，他們都是從Python的官方源pypi.python.org/pypi 下載到本地，然後解包安裝。不過因爲某些原因，訪問官方的pypi不穩定，很慢甚至有些還

2020-06-24 08:22:04

1.分區過濾分區過濾什麼什麼意思：如果不加分區，默認會掃描整個表的數據分區用什麼來描述：一般有時間，如year，month，day，hour，當正常表的字段使用怎麼知道一個表是否有分區看錶的字段是否有類似“month，day，h

2020-02-21 19:07:08

點贊收藏分享文章舉報奇允發佈了31 篇原創文章 · 獲贊 9 · 訪問量 3萬+ 私信關注

2020-02-21 19:07:08

前言公司運營、BI以及財務不同部門不同人員需要hive數據查詢服務，所以需要分配不同的權限給相關人員權限配置主要涉及兩項： - 認證(authentication)：驗證用戶所用的身份是否是對的 - 授權(authoriza

2020-02-21 19:07:08

1.spark的謠言粉粹系列 1.1 Spark Misconceptions 解釋了spark不是內存計算模型、spark對比hadoop並不能都快10x-100x、spark並不是什麼新的技術 1.2 spark系列

2020-02-21 19:07:08

通過java登錄cloudera manager，並進行impala query歷史查詢示例！ package commons; import org.apache.commons.httpclient.Cookie; import o

2020-02-21 19:07:08

相信使用cloudera manager管理集羣最先遇到的一個問題就是目錄空間不夠默認路徑都在系統盤，系統盤一般不會很大。所以最笨的辦法是安裝包的路徑和各個組件輸出路徑配置到其他大的目錄，但這種方式不利於維護！我現在都是所有報

2020-02-21 19:07:08

1.mapreduce的map、shuffle、reduce過程點贊收藏分享文章舉報奇允發佈了31 篇原創文章 · 獲贊 9 · 訪問量 3萬+ 私信

2020-02-21 19:07:08

CDH這個大包沒有將kafka集成進來，所以單獨來說下kafka 既然kafka沒有被集成進來，爲什麼添加服務的時候能看到有kafka 所看到的其實是Kafka Custom Service Descriptor (CSD)，

2020-02-21 19:07:07

配置源碼支持下載編碼爲gb2312 默認下載編碼是UTF-8 源碼路徑：/opt/cloudera/parcels/CDH/lib/hue/desktop/core/src/desktop/lib/export_csvxls.p

2020-02-21 19:07:07