Hadoop:CCAH及CCA系列認證

一、CCAH Administrator Hadoop管理員認證

認證準備建議:Hadoop管理員培訓

考試形式:90分鐘;70%通過;60道多項選擇題(會提示是單選or多選)

培訓內容

通過講師在課堂上的講解,以及實操練習,學員將學習以下內容:

Cloudera Manager管理機羣的特性,譬如日誌彙總、配置管理、報告、報警及服務管理。 YARN、MapReduce、Spark及HDFS的工作原理。

如何爲你的機羣選取合適的硬件和架構。

如何將 Hadoop 機羣和企業已有的系統進行無縫集成。

如何使用Flume 進行實時數據採集以及如何使用Sqoop在RDBMS和Hadoop機羣之間進行數據導入導出。

如何配置公平調度器爲Hadoop上的多用戶提供服務級別保障。

產品環境中Hadoop機羣的最佳運維實踐。

Hadoop機羣排錯、診斷問題和性能調優。

培訓對象及學員基礎

“面向系統管理員和IT 經理,需具備Linux 經驗,無需Apache Hadoop 基礎。

認證 “結束本課程培訓後,我們建議學員準備並註冊參加Cloudera 認證 Hadoop 管理員考試(CCAH)。通過並獲取該證書是向公司及客戶證明個人在Hadoop 領域的技術和專長的有力依據。

 

二、CCA Spark and Hadoop Developer開發者認證

認證準備建議:Spark andHadoop開發者培訓

考試形式:120分鐘;70%通過;解決10~12基於CDH5機羣上需通過實際操作的問題

培訓內容

通過講師在課堂上的講解,以及實操練習,學員將學習以下內容:

在 Hadoop 機羣上進行分佈式存儲和處理數據。

在 Hadoop 機羣上編寫、配置和部署 Apache Spark 應用。

使用 Spark shell 進行交互式數據分析。

使用 Spark SQL 查詢處理結構化數據。  

使用 Spark Streaming 處理流式數據。

使用 Flume 和 Kafka 爲 Spark Streaming 採集流式數據。

培訓對象及學員基礎

本課程適合於具有編程經驗的開發員及工程師。無需 Apache Hadoop 基礎,培訓內容中對 Apache Spark 的介紹所涉及的代碼及練習使用 Scala 和Python,因此需至少掌握這兩個編程語言中的一種。需熟練掌握 Linux 命令行。對 SQL 有基本瞭解。

 

三、CCA Data Analyst數據分析師認證

認證準備建議:DataAnalyst數據分析師培訓

考試形式:120分鐘;70%通過;解決10~12個客戶問題,對於每一個問題,考生必須給出一個滿足所有要求的精確的技術解決方案。考生可在羣集上使用任何工具或組合使用工具。

培訓內容

通過講師在課堂上的講解,以及實操練習,學員將熟悉Hadoop生態系統, 學習主題包括:

Pig、Hive 和 Impala 針對數據採集、存儲和分析而提供的功能。

Apache Hadoop的基本原理,以及使用Hadoop工具進行數據ETL(提取、

轉換和加載)、擷取和處理。

Pig、Hive 和 Impala 是如何提高典型分析任務的處理效率的。

聯接多種多樣的數據集,以獲得有價值的商業洞察力。

執行實時、複雜的數據集查詢。

培訓對象和學員基礎

本課程是專爲數據分析師、商業智能專家、開發人員、系統架構師和數據庫管理員開發的。培訓學員需具備一定的SQL知識水平,且基本熟悉 Linux 命令行。培訓學員至少熟悉一種腳本語言知識(例如,Bash 腳本編程、 Perl、Python和 Ruby)將會更有幫助,但不是必需的。此外,培訓學員不需要具備Apache Hadoop知識。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章