Hadoop的生態系統

原創

2020-02-25 20:23

How did it all start- huge data on the web!
Nutch built to crawl this web data
Huge data had to saved- HDFS was born!
How to use this data?
Map reduce framework built for coding and running analytics – java, any language-streaming/pipes
How to get in unstructured data – Web logs, Click streams, Apache logs, Server logs – fuse,webdav, chukwa, flume, Scribe
Hiho and sqoop for loading data into HDFS – RDBMS can join the Hadoop band wagon!
High level interfaces required over low level map reduce programming– Pig, Hive, Jaql
BI tools with advanced UI reporting- drilldown etc- Intellicus
Workflow tools over Map-Reduce processes and High level languages
Monitor and manage hadoop, run jobs/hive, view HDFS – high level view- Hue, karmasphere, eclipse plugin, cacti, ganglia
Support frameworks- Avro (Serialization), Zookeeper (Coordination)
More High level interfaces/uses- Mahout, Elastic map Reduce
OLTP- also possible – Hbase

出處：http://indoos.wordpress.com/2010/08/16/hadoop-ecosystem-world-map/

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

14 hive安裝

1.hive 1.1 解壓 tar -zxf apache-hive-1.2.2-bin.tar.gz -C .. mv apache-hive-1.2.2-bin/ hive-1.2.2 1.2 修改配置

2024-05-14 00:41:14

HBase Meta 元信息表修復實踐

作者：vivo 互聯網大數據團隊 - Huang Guihu、Chen Shengzun HBase是一款開源高可靠、高可擴展性、高性能的分佈式非關係型數據庫，廣泛應用於大數據處理、實時計算、數據存儲和檢索等領域。在分佈式集羣中，硬件故

2024-05-09 12:43:33

Impala數據文件的碎碎念

Impala目前支持Hadoop中幾種常見的文件格式 Parquet 、 ORC 、 Text 、 Avro 、 RCFile 和 SequenceFile 。下面簡要說明各種格式的使用、限制和一些注意事項。不同的文件格式有着不同的適用場

2024-05-12 21:38:18

O2OA(翱途)開發平臺爲待辦創建配置郵件通知

O2OA(翱途)開發平臺[下稱O2OA開發平臺或者O2OA]的消息機制允許開發者通過配置實現郵件通知。本篇主要闡述如何實現待辦消息的郵件通知。一、先決條件： 1、O2Server服務器正常運行，系統安裝部署請參考

2024-05-09 23:10:17

一鍵自動化博客發佈工具,用過的人都說好(infoq篇)

infoq的博客發佈界面也是非常簡潔的。首頁就只有基本的標題，內容和封面圖片，所以infoq的實現也相對比較簡單。一起來看看吧。前提條件前提條件當然是先下載 blog-auto-publishing-tools這個博客自動發佈工具,地

2024-05-10 21:47:53

一鍵自動化博客發佈工具,用過的人都說好(cnblogs篇)

cnblogs和其他的博客平臺相比會比較複雜，需要設置的項目也比較多一些，弄懂了cnblogs的實現方式，那麼你應該對selenium的整個框架使用已經爛熟於心了。除了正常的標題，內容，摘要之外，cnblogs還需要設置個人分類，合集，投

2024-05-09 21:45:36

一鍵自動化博客發佈工具,用過的人都說好(阿里雲篇)

阿里雲有個開發者社區，入駐過的朋友可能想要把自己的博客發佈到阿里雲社區上。今天我來介紹一下blog-auto-publishing-tools自動發佈博客到阿里雲的實現原理。阿里雲的博客發佈界面比較簡單，只有標題，正文，摘要，關聯試用產

2024-05-08 21:33:08

一鍵自動化博客發佈工具,用過的人都說好(oschina篇)

oschina和segmentfault一樣，界面非常的清爽。界面上除了必須的標題,內容之外，還有文章專輯和推廣專區這幾個選項。一起來看看在blog-auto-publishing-tools中，是如何實現自動發佈到oschina的吧。

2024-05-07 21:30:39

一鍵自動化博客發佈工具,用過的人都說好(segmentfault篇)

segmentfault是我在這些平臺中看過界面最爲簡潔的博客平臺了。今天就以segmentfault爲例，講講在blog-auto-publishing-tools中的實現原理。前提條件前提條件當然是先下載 blog-auto-pu

2024-05-06 21:30:45

一鍵自動化博客發佈工具,chrome和firfox詳細配置

blog-auto-publishing-tools博客自動發佈工具現在已經可以同時支持chrome和firefox了。很多小夥伴可能對於如何進行配置和啓動不是很瞭解，今天帶給大家一個詳細的保姆教程，只需要跟着我的步驟一步來就可以無障礙啓

2024-05-04 21:30:29

一鍵自動化博客發佈工具,用過的人都說好(簡書篇)

好不容易寫好了一篇博客，現在想要把它發佈到各個平臺上供大家一起欣賞？然後一個網站一個網站打開要發佈的博客站點，手動點創建文章，然後拷貝粘貼寫的markdown文件。甚至有些網站還不支持markdown格式，你還需要對格式進行轉換。每次

2024-04-30 21:30:54

界面組件DevExpress中文教程 - 如何在Node.js應用中創建報表？

DevExpress Reporting是.NET Framework下功能完善的報表平臺，它附帶了易於使用的Visual Studio報表設計器和豐富的報表控件集，包括數據透視表、圖表，因此您可以構建無與倫比、信息清晰的報表。獲取Dev

2024-04-30 11:36:22

6個實例帶你解讀TinyVue 組件庫跨框架技術

本文分享自華爲雲社區《6個實例帶你解讀TinyVue 組件庫跨框架技術》，作者：華爲雲社區精選。在DTSE Tech Talk 《手把手教你實現mini版TinyVue組件庫》的主題直播中，華爲雲前端開發DTSE技術佈道師阿健老師給

2024-04-26 10:33:20

「Java開發指南」如何用MyEclipse搭建GWT 2.1和Spring？（一）

本教程將指導您如何生成一個可運行的Google Web Toolkit (GWT) 2.1和Spring應用程序，該應用程序爲域模型實現了CRUD應用程序模式。在本教程中，您將學習如何：安裝Google Eclipse插件爲GWT配置

2024-05-08 11:36:35

消費者太多！RocketMQ又炸了！

去年寫過一篇《Topic數量太多！RocketMQ炸了！》，大家評價還不錯。結果，2024年的開頭，我們的RocketMQ又炸了！ 1、問題現象先說明下RocketMQ版本， 4.6.0的老版本了。線下環境客戶端啓動會頻

2024-05-13 12:34:50

24小時熱門文章

最新文章

最新評論文章