台部落村里的intern

1.extract timestamp field from events use org.apache.flume.interceptor.Reg

2020-06-03 04:57:02

1

本文所涉及的內容是在做傳染病領域的科研時做的一些探索性的工作，肯定還是有一些不完善的地方，歡迎討論。本文最終的目的是實現一個社會網絡的動態演變過程，如下圖所示，這是程序最終生成的視頻，導出的一小段GIF。照慣例推薦幾篇非常好的參考文

2020-06-03 04:57:02

35

Kafka的分區策略是按照用戶自定義的key字段，計算hashcode，按計算結果將該條日誌存儲到相應編號的分區中。舉個例子，比如DB2的一條日誌： 2015-06-18-22.24.52.052782

2018-08-30 17:07:01

1

本文所涉及的內容是在做傳染病領域的科研時做的一些探索性的工作，肯定還是有一些不完善的地方，歡迎討論。本文最終的目的是實現一個社會網絡的動態演變過程，如下圖所示，這是程序最終生成的視頻，導出的一小段GIF。照慣例推薦幾篇非常好的參考文

2018-08-30 17:07:01

66

實現了通過flume-ng將DB2日誌推入Kafka，用spark streaming訂閱kafka中相應的topic，將指定的信息，比如level級別是warning的，message發送給指定郵箱 1

2018-08-30 17:07:01

1.flume一般按行爲單位封裝一個event，並對event進行消費、過濾、攔截。針對DB2的日誌，多行爲一個event，而且行數不一致，所以我們最好定製自己的source component，我簡單修

2018-08-30 17:07:01

1

本文使用的Spark版本是1.4.0，Elasticsearch版本是1.5.2 1.Elasticsearch對Spark的支持詳見官網：https://www.elastic.co/guide/en/elasticsearch/had

2018-08-30 17:07:01

大數據時代，隨着數據量不斷增長，存儲與計算集羣的規模也逐漸擴大，幾百上千臺的雲計算環境已不鮮見。現在的集羣所需要解決的問題不僅僅是高性能、高可靠性、高可擴展性，還需要面對易維護性以及數據平臺內部的數據共享性等諸多挑戰。優秀的系統運維平臺既

2018-08-30 17:07:00

3

4

本文涉及的所有操作均在一個CentOS 6.5虛擬機內,部署成功後可供開發和測試使用各程序版本：apache-flume-1.7.0 apache-tomcat-7.0.27 elasticsear

2018-08-30 17:06:39

3