原创 0019-Yarn的JobHistory目錄權限問題導致MapReduce作業異常

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.問題描述 Hive的MapReduce作業無法正常運行,日誌如下: 0: jdbc:hive2://localhost:10000>select count(*) fr

原创 0018-大數據售前的中年危機

本文所述純屬虛構,如有雷同,一定是你不懂大數據。“Big data is like teenage sex: everyone talks about it, nobody really knows how to do it,everyo

原创 0016-Avro序列化&反序列化和Spark讀取Avro數據

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.簡介 本篇文章主要講如何使用java生成Avro格式數據以及如何通過spark將Avro數據文件轉換成DataSet和DataFrame進行操作。 1.1Apache

原创 0011-如何在Hive & Impala中使用UDF

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.文檔編寫目的 本文檔講述如何開發Hive自定義函數(UDF),以及如何在Impala中使用Hive的自定義函數,通過本文檔,您將學習到以下知識: 1.如何使用Java開

原创 0013-如何在Kerberos與非Kerberos的CDH集羣BDR不可用時複製數據

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.概述 本文檔描述了在Kerberos與非Kerberos的CDH集羣之間BDR不可用的情況下實現數據互導。文檔主要講述 1.測試集羣環境描述 2.CDH的BDR功能驗證

原创 0010-Hive多分隔符支持示例

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.問題描述 如何將多個字符作爲字段分割符的數據文件加載到Hive表中,事例數據如下: 字段分隔符爲“@#$” test1@#$test1name@#$test2value

原创 0014-Hive中的Timestamp類型日期與Impala中顯示不一致分析

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.問題描述 Hive表中存儲的Timestamp類型的字段顯示日期與Impala中查詢出來的日期不一致。 2.問題復現 1.創建一個簡單的測試表 2.向表中插入一條測

原创 0012-什麼是數據科學工作臺?爲什麼數據科學家需要它?

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 數據科學本質上是一個探索和創新的過程,因爲通常對於現在的問題沒有明確的答案,也沒有獲得答案的確定的途徑。數據科學家用數據和他們的經驗研究問題,探索數據,創建模型,然後通過這

原创 0015-如何使用Sentry管理Hive外部表權限

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.文檔編寫目的 本文檔主要講述如何使用Sentry對Hive外部表權限管理,並基於以下假設: 1.操作系統版本:RedHat6.5 2.CM版本:CM 5.11.1 3.

原创 0007-如何遷移Cloudera Manager節點

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.概述 本文檔講述如何將Cloudera Manager在Kerberos環境下遷移至新的CM節點。通過本文檔,您將學習到以下知識: 1.如何遷移Cloudera Man

原创 0004-Hive表字段Comment中文亂碼

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.問題描述 默認Hive中創建有中文註釋的表時,無論是在Hive CLI還是Hue中該註釋顯示都會是亂碼。如使用以下建表語句: create external tabl

原创 0005-Windows Kerberos客戶端配置並訪問CDH

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.概述 本文檔描述Windows Server2008 R2(windows的內核版本是6.1,與windows 7相同)下安裝Kerberos Client及FireF

原创 0006-Zookeeper指標分析

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1. 問題描述 通過CDH管理平臺,進入Zookeeper管理界面,Zookeeper的平均請求延遲、最小請求延遲、最大請求延遲指標趨勢圖維持不變,指標數據異常。 2.問題

原创 0009-如何升級Cloudera Manager和CDH

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.文檔編寫目的 本文檔講述如何升級Cloudera Manager和CDH,通過本文檔,您將學習到以下知識: 1.如何對Cloudera Manager進行停機升級 2.

原创 0008-如何卸載CDH(附一鍵卸載github源碼)

溫馨提示:要看高清無碼套圖,請使用手機打開並單擊圖片放大查看。 1.前置條件 本文檔將介紹Cloudera Manager與CDH的卸載,並基於CDH使用parcels安裝且未配置安全(AD/LDAP, Kerberos, Data E