原创 kafka同一個topic和gruopid下的雙flume客戶端消費測試

業務場景:單個flume客戶端無法消費某個數據量很大的topic,因此起兩個flume去消費同一個topic 數據流:kafka--->flume---->oss(阿里雲的分佈式存儲服務,可以是hdfs) 01.conf 和 02.con

原创 Superset 集成mysql數據庫及報錯 No module named 'MySQLdb'解決

superset安裝請參考 https://blog.csdn.net/qq_34864753/article/details/93517511 這是superset添加數據源的界面 點擊Test Connection 報錯  No

原创 kerberos環境下的presto集羣安裝

1. 沒有kerberos環境的presto集羣安裝請參考 https://blog.csdn.net/Alongpo/article/details/89499400 kerberos安裝需更改 /catalog 下的hive.prop

原创 sentry權限查看

搭建的CDH集成了sentry,通過HUE來設置相關權限,具體角色有哪些權限呢?如何查看? 1. 進入sentry所在數據庫 跟權限相關的就下兩個表    

原创 CDH啓用Kerberos導致hdfs,yarn等頁面無法訪問解決

CDH啓用Kerberos,導致namenode和resourcemanager等頁面無法訪問,訪問頁面的時候報錯  Problem accessing /cluster. Reason 解決方案: 將hdfs/yarn的配置中這個勾選去

原创 CDH 6成功啓動spark-thrift服務(CDH 6.2.0)

因爲CDH自身集成的spark不包含thrift服務,因公司業務需求,需在集成了Kerberos&LDAP的CDH集羣中啓用spark-thrift服務   吐槽一句,百度出來的都是沒用的,還是翻牆找到解決方案的 1. 下載spark 安

原创 CDH以及原生態HUE下載條數限制修改(默認10w行)

1.CDH版 需要到CDH的Cloudera Manager中進入HUE配置 hue_safety_valve.ini 的 Hue 服務高級配置代碼段(安全閥)配置項 然後加入 [beeswax] download_row_limit=5

原创 Druid(0.15.0版本)數據分析工具實際使用指南(Druid 0.15.0版本)(更新中)

1. 刪除數據      1.dropByInterval  已有的interval,假如要刪除某些interval,例:刪除19年5月到6月的數據 2019-05-01T00:00:00.000Z/2019-01-01T00:00:

原创 Imply方式安裝0.15.0版本Druid和實例(hdfs->druid)分享

1. 下載imply ,解壓 https://imply.io/get-started tar -xzf imply-3.0.12.tar.gz impy quickstart鏈接地址(供參考) https://docs.imply

原创 haproxy+keepalived實現hiveserver2負載均衡(源碼和yum安裝haproxy+keepalived)

1. 準備工作 yum install gcc gcc-c++ make openssl-devel kernel-devel 2. Haproxy安裝(源碼安裝) 本次安裝使用的版本是 haproxy-1.5.14.tar.gz 1.

原创 Hadoop namenode啓動之後datanode啓動不了

在將非HA的namenode轉爲 HA的配置過程中執行格式語句,啓動的時候發現namenode起了,datanode沒啓動 hadoop namenode -format sbin/start-dfs.sh  1. 查看日誌  hadoo

原创 Hue權限管理實操

1. 收回某個user的role revoke role role_name from user user_name; 2.收回某個role的某張表的權限 revoke select on table table_name from

原创 zookeeper安裝

見連接 https://note.youdao.com/ynoteshare1/index.html?id=5670dd2469e1c12a0b89d86ee3c98b2c&type=note

原创 linux系統卸載jdk

參考  https://www.cnblogs.com/xinjie10001/p/6287124.html     一、查看Jdk的安裝路徑:   whereis java which java (java執行路徑) echo $JAV

原创 linux jps命令報錯-bash: jps: command not found 解決方案

參考   https://blog.csdn.net/zhanglu1236789/article/details/50445261 1.要知道jps跟jdk有關,也就是跟自己安裝的java相關 2.知道自己java的安裝路徑   whe