原创 【轉】【HDFS】hive任務報HDFS異常:last block does not have enough number of replicas

HIVE運行查詢腳本時報錯,last block does not have enough number of replicas: 1 2018-10-15 2018-07-17 2 2018-10-15 10:00:01

原创 執行sql時出現錯誤 extraneous input ';' expecting EOF near ''

原文問題: 調用jdbc執行hive sql時出現錯誤 Error while compiling statement: FAILED: ParseException line 5:22 extraneous input ';' expe

原创 【轉】箱線圖

作者:海致BDP 鏈接:https://www.zhihu.com/question/36172806/answer/308908220 來源:知乎 著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。   箱線圖判斷異常

原创 【轉】shell 使用指定的分割符來分割字符串

shell 如何用指定的分隔符來分割字符串讓結果爲一個字符串數組,類似 java 中的 split, 而 split 關鍵字已經留給文件分割了,故字符串就分割處理就不能在使用了,那如何來處理字符串串分割呢?方法有兩種 方法一 #!/bi

原创 shell腳本:Syntax error: Bad for loop variable錯誤解決方法

ubuntu16.06輸出循環數字: 命令行中: for i in {1..5}; do echo $i; done #result 1 2 3 4 5 但是將for i in {1..5}; do echo $i; done,寫到s

原创 Precision、Recall、F-measure、ROC曲線、AUC理解

首先,在試圖弄懂AUC和ROC曲線之前,一定,一定要徹底理解混淆矩陣的定義!!! 混淆矩陣中有着Positive、Negative、True、False的概念,其意義如下: 稱預測類別爲1的爲Positive(陽性),預測類別爲0的爲Ne

原创 【轉】基於Hadoop的數據倉庫Hive 基礎知識

基於Hadoop的數據倉庫Hive 基礎知識 - miao君的文章 - 知乎 https://zhuanlan.zhihu.com/p/25608332 Hive是基於Hadoop的數據倉庫工具,可對存儲在HDFS上的文件中的數據集進行數

原创 select語句完整語法及執行流程

select語句完整語法及執行流程 select  目標表的列名或列表達式序列         from 基本表名和(或)視圖序列         [where 行條件表達式]         [group by  列名序列]      

原创 【轉】SQL ROW_NUMBER() OVER函數的基本用法

語法:ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN) 簡單的說row_number()從1開始,爲每一條分組記錄返回一個數字,這裏的ROW_NUMBER() OVER (ORD

原创 hive執行報錯:Both left and right aliases encountered in JOIN 's1'

原因:兩個表join的時候,不支持兩個表的字段 非相等 操作。 可以把不相等條件拿到 where語句中。 例如: right JOIN test.dim_month_date p2

原创 SQL在線練習

鏈接:SQL Teaching 基本SQL命令練習

原创 Hadoop Streaming

Hadoop Streaming Hadoop streaming是Hadoop的一個工具, 它幫助用戶創建和運行一類特殊的map/reduce作業, 這些特殊的map/reduce作業是由一些可執行文件或腳本文件充當mapper或者r

原创 【轉】xargs與管道 | 區別

實例1: $ echo '--help' | cat --help //該命令輸出的是echo的內容,也就是說將echo的內容當作cat處理的文件內容了,實際上就是echo命令的輸出通過管道定向到cat的輸入了。 然後cat從其標

原创 提升hive效率的最佳實踐

表相關 存儲格式: 避免使用text,JSON,有可能的haul也應避免sequence文件; 理想的格式是RCFile (Row Columnar File) 壓縮: block compression 比 value compress

原创 【轉】關於滴滴智能調度的分析和思考

 AnthonyD 關注 2017.01.15 23:55* 字數 3809 閱讀 10743評論 1喜歡 47讚賞 3寫這篇分析的背景是,工作上正在經歷一個智能調度平臺的搭建和設計,希望通過對於滴滴調度系統進行調研,來得出一些可借鑑的、