原创 kafka使用mysql進行認證管理

目錄背景SASL/SCRAMSASL/PLAIN改造新建mysql 元信息庫新增mysql 連接池工具類修改PlainSaslServer類打包測試兼容上線後續 背景     因爲公司其他業務方使用的語言多種多樣,以C和C++爲主

原创 修改源碼使kafka-console-consumer.sh支持從指定時間開始消費

目錄背景解決方案方案1-用Java新開發一個的消費工具方案2-修改kafka源碼,利用kafka-console-consumer.sh方案2-flinkSQL 或 kafka SQL環境準備修改代碼打包測試 背景       

原创 kafka只讓Producer自動創建Topic同時禁止consumer自動創建Topic

kafka只讓Producer自動創建Topic背景操作後記 背景     最近我們要做從mysql 到大數據平臺的數據流轉,定下的方案是maxwell同步binlog到kafka中,再由flink消費kafka的數據寫往kudu

原创 Maven編譯系列(一)——Plugin

做java開發的肯定對maven再熟悉不過了,可是我之前對maven的瞭解卻也僅限於拷貝pom模版,然後添加自己的dependecy而已,頂多加上build和repository這兩個參數來指定java版本和maven源,最後編譯這塊兒還

原创 大數據平臺部署-----ambari在線和離線安裝

一、在線編譯安裝1.1.  安裝獨立maven1.1.1.       下載Mavenwget http://mirrors.tuna.tsinghua.edu.cn/apache/maven/maven-3/3.5.2/binaries

原创 kafka connector 中的輕量級ETL-transfomation功能介紹

在kafka connector的使用中,可能因爲各種原因(業務原因、connector需要key或者schema等)需要用到transfomation,處理消息的內容。下面列舉了kafka connector 自帶的transfomat

原创 CDH添加服務-----以sentry爲例

1.  背景雖然在集羣上部署了kerberos認證,但是kerberos只是對用戶層面進行認證,凡是認證通過的用戶都有全量的訪問權限,這很不安全,需要進一步對用戶的權限進行控制,Sentry 的作用就是這個。2.  添加Sentry服務2

原创 sqoop源碼解析-----從mysql到hive爲例

    上班這麼久了,大部分時間都是在大數據平臺組件的基礎上做一些小的開發,既然是在別人的東西上修改,除了百度或者谷歌搜索前人的講解,自己閱讀源碼一定是必不可少的。但是源碼裏代碼量那麼大,往往一時間多很難找到整個程序的入口,這時候 往往容

原创 大數據平臺運維-----Kerberos環境下Hive及Impala監控腳本的開發

一、工程目錄二、原理解析    Hive和Impala是兩個最常用的大數據查詢工具,他們的主要區別是Hive適合對實時性要求不太高的業務,對資源的要求較低;而Impala的由於採用了全新的架構,處理速度非常的快,但同樣的也對資源消耗比較大

原创 大數據平臺部署------CDH啓用TLS加密傳輸

1.  TLS介紹1.1.   背景部署了Kerberos之後,CM會提示有安全隱患,至少需要一級TLS加密。1.2.  相關知識傳輸層安全性(TLS)在ClouderaManager服務器和代理之間的通信中提供加密和身份驗證。 加密可防

原创 HDFS、Hive、HBase常用命令整理

對於一個初學者來說,HDFS、Hive、Hbase常用命令比較多,一時間又難以記住,這裏做一個小小的整理總結1.  Hadoop命令文件瀏覽,不能遞歸顯示 hadoop fs –ls /[path] 遞歸顯示文件 hadoop fs –l

原创 kafka自動化腳本部署

一、背景    如果不採用CDH或者ambari等平臺來部署kafka的話,一臺一臺的安裝,一臺一臺的改配置,真的是一個非常讓人頭疼的事情呢,經領導提示,爲什麼不寫個shell腳本來進行一件部署呢二、java自動部署if [ ! -d /

原创 kafka集羣安全化之啓用kerberos與acl

一、背景在我們部署完kafka之後,雖然我們已經可以“肆意”的用kafka了,但是在一個大公司的實際生產環境中,kafka集羣往往十分龐大,每個使用者都應該只關心自己所負責的Topic,並且對其他人所使用的Topic沒有權限。這樣一來可以

原创 Kerberos常用命令總結

進入kadmin kadmin.local/kadmin 創建數據庫 kdb5_util create -r JENKIN.COM -s  啓動kdc服務 service krb5kdc start 啓動kadmin服務 service

原创 大數據平臺部署-------CDH集羣中啓用kerberos認證

1.  Kerberos部署1.1.安裝相關軟件server端 yum -y install krb5-server krb5-libs krb5-auth-dialog Agent端 yum install krb5-devel krb