原创 HBase shell 命令入門

HBase Shell 名字可歸類以下6部分: 1) General  HBase shell commands status Show cluster status. Can be ‘summary’, ‘simpl

原创 DAG (directed acyclic graph) 作爲大數據執行引擎的優點

TL;DR - Conceptually DAG model is a strict generalization of MapReduce mod

原创 storm運行異常之No output fields defined for component:stream XxxBolt:null疑案追蹤

前言 上一篇寫了 storm運行異常之No output fields defined for component:stream XxxBolt:null 發現是多線程導致的,但是也有可能是其他原因,今天就來追蹤一下。 反查蛛絲馬跡 錯

原创 Mapreduce 導出HBase table 數據到HDFS路徑

前言 由於HBase到Hive的Mapping無法把timestamp映射過去,見官方解釋:https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration Colum

原创 Logstash實踐之MySQL Slowlog解析

Logstash實踐之MySQL Slowlog解析 logstash config script input { file { path => ["/apps/svr/logstash/log/slow3306.

原创 Elasticsearch 5.0 簡介(medcl微信直播實錄)

大家好,非常高興能在這裏給大家分享,感謝InfoQ提供的這個微信的平臺,首先簡單自我介紹一下,我叫曾勇,是Elastic的工程師。 Elastic將在今年秋季的時候發佈一個Elasticsearch V5.0的大版本,這次的微信分享將給大

原创 Storm雜談之Acker拾趣

Storm雜談之Acker拾趣 本文所講內容並非storm的acker機制,如果想看acker機制的讓您失望了,不過在此奉上徐明明大牛的blog: Twitter Storm源代碼分析之acker工作流程 Twitter Storm

原创 Streaming Real-time Data Into HBase

Fast-write is generally a characteristic strength of distributed NoSQL databases such as HBase, Cassandra. Yet, for a d

原创 Linux索引節點(Inode:no space for device)用滿導致的一次故障

問題描述 在storm測試環境集羣上上nimbus和supervisor自動掛調,重啓時顯示no space for device,也不能創建,添加文件及目錄,df -h查看 ilesystem Size Use

原创 Logstash 實踐之Redis日誌解析

Logstash 實踐之Redis日誌解析 logstash config 腳本配置 input { file { path => ["/apps/svr/logstash/log/redis1.log"]

原创 Elasticsearch custom analyzer with custom pattern(自定義Analyzer的分詞pattern)

DELETE testindex PUT testindex { "index" : { "analysis" : { "tokenizer" : { "c

原创 logstash 學習小記

logstash 學習小記 標籤(空格分隔): 日誌收集 Introduce Logstash is a tool for managing events and logs. You can use it to collect log

原创 如何在運行時加載C++函數和類

如何在運行時加載C++函數和類 標籤(空格分隔): 編程 Problem 有些時候你想在運行時加載一個lib或者function or class,這種事情經常發生在你開發一個plugin或者module時遇到。 在C語言裏,你可以輕鬆

原创 Logstash 實踐之Spark Driver日誌解析

Logstash 實踐之Spark Driver日誌解析 logstash config script input { file { path => ["/apps/svr/logstash/log/telesco

原创 個性化推薦的十大挑戰

個性化推薦的十大挑戰 標籤(空格分隔): 大數據 個性化推薦 機器學習 1.數據稀疏問題 Z. Huang, H. Chen, D. Zeng, Applying associative retrieval techniques t