台部落lllW

1.準備編寫udf環境引入依賴 <dependencies> <dependency> <groupId>jdk.tools</groupId>

2020-06-20 07:00:49

1.現象在監控頁面job運行完成了，但是程序還在運行，要等好久才能結束 2.原因： spark 2.0 在保存數據的時候會用 FileOutputCommitter ，問題就出在了 Hadoop 2.0 FileOutputCom

2020-06-14 23:31:59

解決步驟 1.配置mysql遠程連接 2.然後初始化 schematool -dbType mysql -initSchema 報錯如下解決辦法修改 hive-site.xml 如下：第二個問題解決之後，然後在進行

2020-06-14 23:31:59

1.hadoop3.0啓動成功，但是web頁面無法顯示子節點現象：子節點啓動日誌報錯原因：/etc/hosts 主機名和IP映射配置錯誤,導致從節點無法訪問主節點解決：參考：http://blog.chinaunix.net

2020-06-14 23:31:59

1：合併記錄　　該步驟用於將兩個不同來源的數據合併，這兩個來源的數據分別爲舊數據和新數據，該步驟將舊數據和新數據按照指定的關鍵字匹配，　　比較，合併。　　需要設置的參數：　　舊數據來源：舊數據來源的步驟。　　新數據來源

2020-05-30 21:37:29

2

1：列轉行 2：列轉行 3：去除重複記錄步驟名稱：保持唯一性增加計數器到輸出？：當勾選了此項，並在計數器字段後給予了名稱，則將會在該字段下顯示去掉的重複行數。字段名稱：用來去重的字段，可選多個字段

2019-06-12 01:49:50

--HBase技術介紹 HBase簡介HBase –Hadoop Database，是一個高可靠性、高性能、面向列、可伸縮的分佈式存儲系統，利用HBase技術可在廉價PC Server上搭建起大規模結構化存儲集羣。HBase是Google

2018-09-01 23:57:41

3

phoenix是什麼？Apache Phoenix 是運行在Hbase之上的高性能關係型數據庫，通過Phoenix可以像使用jdbc訪問關係型數據庫一樣訪問hbase。Phoenix，操作的表以及數據存儲在hbase上。phoenix只需

2018-09-01 23:57:38

1