如何在Hive中使用Struct類型

溫馨提示:如果使用電腦查看圖片不清晰,可以使用手機打開文章單擊文中的圖片放大查看高清原圖。

Fayson的github: https://github.com/fayson/cdhproject

提示:代碼塊部分可以左右滑動查看噢

1.文檔編寫目的


Hive中支持多種數據類型除了常用的TINYINT、SMALLINT、INT、BIGINT、BOOLEAN、FLOAT、DOUBLE、STRING、BINARY、TIMESTAMP、DECIMAL、DATE、VARCHAR、CHAR類型外,當然還包含一些複雜的數據類型(array、map、struct、union)。本篇文章Fayson主要介紹在Hive中使用Struct類型存儲數據。

  • 內容概述

1.環境準備

2.創建Hive表及測試

3.總結

  • 測試環境

1.CM和CDH版本爲5.15

2.環境準備


準備測試數據,文本數據內容如下:

0098.HK,104,2018-10-21T22:20:00.105Z,fayson:男:18
0098.HK,104,2018-10-21T22:20:00.105Z,fayson1:男:19
0098.HK,104,2018-10-21T22:20:00.105Z,fayson2:男:20
0098.HK,104,2018-10-21T22:20:00.105Z,fayson3:男:21
0098.HK,104,2018-10-21T22:20:00.105Z,fayson4:男:22

(可左右滑動)

將準備好的測試數據保存到test.csv文件中,並上傳至HDFS的/mdtick/hk/csv目錄下。

[root@cdh03 ~]# cat test.csv
[root@cdh03 ~]# hadoop fs -put test.csv /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -ls /mdtick/hk/csv/
[root@cdh03 ~]# hadoop fs -cat /mdtick/hk/csv/test.csv

(可左右滑動)

3.創建Hive表


1.使用如下SQL語句創建一個包含Struct類型的表

CREATE EXTERNAL TABLE csvtable2(
    symbol string,
    tickSequence string,
    timeStamp string,
    tickdata struct<
        name: string,
        sex: string,
        age: int
    >
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ','
collection items terminated by ":"
STORED AS TEXTFILE
LOCATION '/mdtick/hk/csv';

(可左右滑動)

如上SQL建表語句中需要注意的是,Struct類型裏面定義的爲字段的名稱與數據類型。Struct類型中定義的字段與示例數據中的“fayson:男:18”是按順序對應起來的。Collection items terminated by “:”,表示Struct類型數據以“:”分割。

2.使用Hue在Hive中創建測試表

3.使用SQL命令查看csvtable2表數據

4.使用SQL語句查看Struct中數據

4.總結


1.在Hive表中定義Struct類型數據,即在Struct中指定相應的字段名及數據類型即可,多個字段以逗號分隔。

2.使用SQL語句查詢Struct中數據方式跟普通的指定字段名方式一樣,無需對數據進行特殊處理即可。

3.Struct同樣也支持其它類型數據的嵌套,如下:

struct<info:Map<String,String>>

struct<info: struct<name:string>>等

提示:代碼塊部分可以左右滑動查看噢

爲天地立心,爲生民立命,爲往聖繼絕學,爲萬世開太平。 溫馨提示:如果使用電腦查看圖片不清晰,可以使用手機打開文章單擊文中的圖片放大查看高清原圖。

推薦關注Hadoop實操,第一時間,分享更多Hadoop乾貨,歡迎轉發和分享

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章