原创 linux readlink命令

readlink是linux系統中一個常用工具,主要用來找出符號鏈接所指向的位置. $ readlink --help //或者man readlink Usage: readlink [OPTION]... FILE Print v

原创 hadoop ls命令

ls 使用方法:hadoop fs -ls <args> 如果是文件,則按照如下格式返回文件信息: 文件名 <副本數> 文件大小 修改日期 修改時間 權限 用戶ID 組ID  如果是目錄,則返回它直接子文件的一個列表,就像在Unix中一樣

原创 【轉】mysql查詢根據部分字段去重

mysql有個關鍵字distinct用來去重的,但是使用時只能放在查詢字段的最前邊 如: SELECT DISTINCT user_id,age FROM t_user; 若不是放在最前邊,如: SELECT user_id, DISTI

原创 linux下解壓命令、壓縮命令大全

linux常用的解壓和壓縮命令如下: 1、.tar  解包:tar xvf FileName.tar 打包:tar cvf FileName.tar DirName (注:tar是打包,不是壓縮!) 2、.gz 解壓1:gunzi

原创 linux >和>>的區別

linux中經常會用到將內容輸出到某文件當中,只需要在執行命令後面加上>或者>>號即可進入操作。 >:將一條命令執行結果(標準輸出,或者錯誤輸出,本來都要打印到屏幕上面的)重定向其它輸出設備(文件,打開文件操作符,或打印機等等) > 重定

原创 hive導出查詢結果到本地文件

hive -e "select * from test" >> res.csv 或者: hive -f sql.hql >> res.csv 其中文件sql.hql內容爲查詢語句  

原创 【轉】sql之left join、right join、inner join的區別

left join(左聯接) 返回包括左表中的所有記錄和右表中聯結字段相等的記錄  right join(右聯接) 返回包括右表中的所有記錄和左表中聯結字段相等的記錄 inner join(等值連接) 只返回兩個表中聯結字段相等的行 舉例

原创 java 8種基本數據類型的默認值

8種基本數據類型(primitive type)在只做了聲明,而未被初始化的時候,他們的默認值  8種基本數據類型分別是:byte,short,int,long,(四種整型)                        char()  

原创 HQL FAILED: ParseException line 13:4 missing KW_END at ‘,’ near ‘‘

hive查詢報錯: FAILED: ParseException line 13:4 missing KW_END at ',' near '<EOF>' 原因:case when then else end;少寫了end  

原创 linux cat命令

cat命令連接文件並打印到標準輸出設備上,cat經常用來顯示文件的內容,類似於下的type命令。 注意:當文件較大時,文本在屏幕上迅速閃過(滾屏),用戶往往看不清所顯示的內容。因此,一般用more等命令分屏顯示。爲了控制滾屏,可以按Ctr

原创 【轉】查詢在一張表不在另外一張表的記錄

參考文獻 http://hi.baidu.com/zdfgng/blog/item/dd5f88359a1cd0260b55a9ce.html 題目 假如要查詢在a表中存在,但是在b表中不存在的記錄,應該如何查詢。爲了便於說明,我們假設a

原创 wc awk命令組合

log.txt文本內容如下: 2 this is a test 3 Are you like awk This's a test 10 There are orange,apple,mongo 命令行方式調用awk awk [-F

原创 Hive 時間日期處理總結

獲取當前時間截: select unix_timestamp(); //結果 1539595903 獲取當前時間1: select current_timestamp(); //結果 2018-10-15 17:34:09.721

原创 python ValueError: invalid literal for int() with base 10: ''

The following are totally acceptable in python: passing a string representation of an integer into int passing a string

原创 MySQL:比較兩個數據表不同部分

三種方法: 在t2表而不在t1表的數據 1、SELECT * FROM t2 WHERE id NOT IN (SELECT id FROM t1); 2、SELECT * FROM t2 WHERE NOT EXISTS(SELECT