hadoop的成員項目簡介

原創

2020-02-21 11:44

Pig：

Hadoop的客戶端；Pig Latin類似sql的面向數據流的語言；pig可以把pig latin映射爲mapreduce作業上傳到集羣運行，減少用戶編寫java的程序；

三種運行方式：shell，腳本，嵌入式

Zookeeper：

Google Chubby的開源實現；通信協調軟件；例如，防止單點失效、處理負載均衡、確認消息是否準確到達；

hbase中數據節點之間協調是通過zookeeper實現的；

Hbase：

hadoop database；是apache的的一個頂級項目；Google Bigtable的開源實現，用一張表就夠了；可以集羣化，可以用多臺節點，分佈式；可以使用shell、web、api等多種方式訪問；是面向列的數據庫，列式數據庫；適合高速讀寫的場景，適合key-value查詢場景；使用HQL查詢語言；NoSQL的典型產品；Not only sql；

Hive：

SQL到mapreduce的映射器；輸入sql語句，對數據進行操作；HiveQL，跟標準幾乎相同，但是不支持更新、索引和事務；

提供shell、JDBC/ODBC、web等接口；

Sqoop：

用於在hadoop和關係型數據庫之間交換數據；通過JDBC接口連入關係型數據庫;滿足高負荷情形的性能要求；

Avro:

數據序列化的工具；

Chukwa：

數據採集和分析框架；

主要進行日誌採集和分析；

收集節點的日誌數據，定時將數據寫入hadoop集羣；定時啓動mapreduce作業數據進行處理加工；

Cassandra：

NoSQL，分佈式的key-value型數據庫；與Hbase類似；只有順序寫，沒有隨機寫的設計；

參考：煉數成金的hadoop課程

發佈了24 篇原創文章 · 獲贊 0 · 訪問量 4萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

跨越雲端，華爲雲技術專家分享高效跨雲遷移實踐

本文分享自華爲雲社區《【華爲雲Stack】【大架光臨】第18期：跨越雲端，華爲雲Stack的高效跨雲遷移實踐》，作者：大架光臨。 1 背景在企業雲化的浪潮中，混合多雲已經是企業IT部署的新常態，虛擬機承載的業務佔據很大的比重。在上雲

2024-06-06 10:56:54

乾貨收藏！Calico的BGP RouteReflector策略實踐

本文分享自華爲雲社區《Calico BGP RouteReflector策略實踐》，作者：可以交個朋友。一背景容器網絡組件Calico支持多種後端模式，有Overlay的IPIP、Vxlan模式，也有Underlay純路由的BGP模

2024-05-29 22:58:38

一文搞懂5種內存溢出案例，內含完整源碼

本文分享自華爲雲社區《10分鐘搞懂各種內存溢出案例！！（含完整源碼，建議收藏）》，作者：冰河。作爲程序員，多多少少都會遇到一些內存溢出的場景，如果你還沒遇到，說明你工作的年限可能比較短，或者你根本就是個假程序員！哈哈，開個玩笑。今天，我

2024-06-05 10:56:55

破除軟件開發困局，基於容器平臺的DevOps轉型實踐

本文分享自華爲雲社區《DevOps賦能行業雲原生數字化轉型》，作者：雲容器大未來。企業軟件開發困局隨着信息化的進程不斷加速，帶來的各種業務應用、平臺應用等軟件資產的複雜度也快速上升。隨之而來的信息化基礎設施能力與軟件工程全生命週期的管

2024-06-03 10:59:23

構建強韌：愛奇藝VRS系統可用性建設實踐

導語：愛奇藝作爲網絡視頻播放平臺，其核心服務是播放用戶選擇的視頻內容。VRS（Video Relay Service）是公司所有平臺播放功能的入口服務，它的主要功能包括播放策略控制（播控）、碼流選擇和下發視頻文件地址等。VRS

2024-05-28 02:22:00

二進制文件查看工具和方法

查看二進制文件可以通過多種方法實現，取決於你想要的具體信息和你使用的操作系統。以下是一些常見的方法和工具：使用十六進制編輯器十六進制編輯器可以顯示文件的十六進制表示和對應的ASCII字符。這些工具非常適合查看和編輯二進制文件。 Win

2024-05-30 02:27:38

scp遠程連接複製文件或目錄

文件拷貝將本地文件拷貝到遠程服務器中 scp 本地文件遠程服務用戶名@遠程服務器IP地址:指定拷貝到遠程服務器的文件夾路徑或 scp 本地文件遠程服務用戶名@遠程服務器名稱:指定拷貝到遠程服務器的文件夾路徑將遠程服務器

2024-05-30 00:06:48

centos7按照MYSQL8（安裝包）

查詢Linux的clibc版本 rpm -qa | grep glibc 現在mysql官網找到對應glibc版本的下載url 然後在linux內下載 wget https://dev.mysql.com/get/Downloads

2024-05-29 22:15:17

星火閃耀，與AI同行丨華爲開發者大會2024社區活動重磅上線！

本文分享自華爲雲社區《星火閃耀，與AI同行丨華爲開發者大會2024社區活動重磅上線！》，作者：華爲雲社區精選。盛夏始，萬物秀，華爲開發者大會2024即將開啓華爲雲開發者社區重磅推出“星火閃耀，與AI同行”線上活動，開發者熱點直播，熱門

2024-06-11 22:57:15

愛奇藝公有云對賬標準化實踐

01 背景雲成本系統化管理公有云作爲基礎架構部核心資源之一，其成本佔比逐年上升，企業對於公有云成本實施精細化管理的需求越來越高。相較於私有化部署主要關注服務器、網設、帶

愛奇藝技術產品團隊

2024-06-08 02:19:16

走進京東“卓越研效架構師”首期研習營圓滿收官

五月的北京，春深半夏，花開滿城。由全國雲計算技術行業產教融合共同體牽頭，攜手工業和信息化部電子第五研究所、E³CI軟件研發效能度量工作委員會以及京東雲共同主辦的“走進京東——卓越研效架構師”研習營，於5月17-18日和24-26日在北京京東

2024-05-31 23:55:49

京東雲5月產品動態

1.【智算服務】新品上線智算平臺GCS是面向AI創業公司和AI從業者的AI算力生命週期管理和AI應用生命週期管理平臺。平臺提供高性價比算力資源，以及基於大模型的AI應用生態市場。提供全網低價算力、幫您快速上手AIGC應用。 2.【節能寶P

2024-05-27 23:56:00

活動預告｜與 Zilliz 共探亞馬遜雲科技中國峯會

亞馬遜雲科技中國峯會是由全球雲計算的開創者和引領者亞馬遜雲科技舉辦的一年一度的科技盛會。參與者將有機會了解雲計算推動行業發展的新趨勢與解決方案、生成式 AI 等前沿技術的落地實踐，通過大量成功案例解析，獲得靈感及經驗來解決實際問題，與業內

2024-05-27 21:25:17

今天！通義靈碼在北京、成都、杭州三城開講啦

通義靈碼自從入職阿里雲以來備受行業關注。5 月 24 日，阿里雲工程師奔赴北京、成都、杭州三城，向企業和開發者介紹並演示通義靈碼，通義靈碼依然是大家話題的C位，並收穫了衆多粉絲。 @杭州阿里雲金融創新峯會今天，2024 阿里雲金融創新峯

2024-05-27 21:13:46

不完全指南：通過可觀察性實現CI/CD的高可用性

隨着技術革新的加速，全球雲計算領域正經歷着一場劇烈的演變。據《福布斯》預計，到2025年，企業將在雲計算基礎設施上花費超過1686億美元。由於大多數應用程序發佈都依賴於雲基礎設施，因此擁有良好的持續集成和持續交付（CI/CD）管道以及端到

2024-05-27 14:04:31

24小時熱門文章

sm4加密工具類

最新文章

最新評論文章