原创 spark消費kafka問題記錄(cdh5.16.2)

  版本如下 kafka和spark都安裝完成後,執行spark2-shell竟然報錯 Error: A JNI error has occurred, please check your installation and try ag

原创 hue集成sentry

  前言 集羣啓用kerberos後,訪問impala的方式除了impala-shell、jdbc工具,還有hue 當然不可能在impala-shell編寫sql,jdbc工具的話,電腦上還得裝kerberos客戶端,雖然不麻煩,確實多了

原创 《kudu官網筆記》4.schema設計

不生產博客,只是官網的搬運工 https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/kudu_schema_design.html column設計 非主鍵可爲

原创 spark消費kafka(cdh啓用kerberos)

不生產博客,只是別人博客的裁縫 一入kerberos深似海,從此節操是個玩意兒 之前寫過一篇spark消費kafka問題記錄(cdh5.16.2),主要記錄了安裝spark2後,spark的問題,和本地可以執行,而一提集羣缺包的問題,這

原创 impala paper筆記

不生產博客,只是漢化別人的成果 目錄 摘要 介紹 用戶角度的impala 物理schema設計 sql 支持 架構 state distribution catalog service FRONTEND BACKEND runtime

原创 《kudu官網筆記》3.在kudu上使用impala

不生產博客,只是官網的搬運工 https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/kudu_impala.html impala與kudu集成,允許你使用im

原创 《impala官網筆記》1.1 impala組件

不生產博客,只是官網的搬運工 目錄  impala daemon  impald statestore  catalog service impala是一個分佈式的mpp數據庫引擎,在cdh集羣中由運行在指定主機上的不同的daemon進

原创 《kudu官網筆記》1.組件和架構

不生產博客,只是官網的搬運工 https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/kudu_concepts_architecture.html 列式存儲 存

原创 調優impala:5個頂級的性能優化對於最牛b的mpp

不生產博客,只是漢化別人的成果 pdf鏈接 https://cdn.oreillystatic.com/en/assets/1/event/193/Tuning%20Impala_%20The%20top%20five%20perfor

原创 《kudu官網筆記》2.使用限制

不生產博客,只是官網的搬運工 https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/kudu_limitations.html schema設計限制 主鍵: 1

原创 kerberos客戶端的安裝(linux和windows版)

  不生產博客,只是別人博客的裁縫 一入kerberos深似海,從此節操是個玩意兒 目錄 windows版(win10) linux版(suse) kerberos基本操作 cdh啓用kerberos後,如果我們需要本地連impala或

原创 《kudu官網筆記》5.kudu事務

不生產博客,只是官網的搬運工 https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/kudu_transaction_semantics.html   這篇自認

原创 《kudu官網筆記》6.kudu後臺的維護任務

不生產博客,只是官網的搬運工 https://docs.cloudera.com/documentation/enterprise/5-16-x/topics/kudu_background_tasks.html kudu依賴很多後臺任

原创 spark RDD源碼

 spark發展至今,核心設計沒什麼大變化,如果想快速瞭解底層實現,可以去看早期的源碼, Branch-0.5分支的,https://github.com/apache/spark/tree/branch-0.5,github直接可以找到

原创 CDH 5.14x 配置hive on spark

cdh版本爲5.14 網上搜hive on spark大都5.9之前或更早,看着挺麻煩的 話不多說 首先在CDH界面,hive配置搜索execution 默認時MR,選spark就ok了 然後提示過期配置重啓服務,重啓的話重啓失敗,報如下