Inceptor命令01-表介紹

Inceptor命令01-表介紹

    • 表的劃分-不同維度
    1. 按 Inceptor的所有權 分類可分爲:外部表(或簡稱爲外表)和託管表(內表)。
    2. 按 表的存儲格式 分類可分爲:TEXT表、ORC表、CSV表和Holodesk表。
    3. 按表 是否分區 可分爲:分區表和非分區表。
    4. 按表 是否分桶 可分爲:分桶表和非分桶表。
    • 表的劃分-所有權
    • 託管表
    CREATE TABLE 默認創建託管表。Inceptor對託管表有所有權——用 DROP 刪除託管表時,Inceptor會將表中數據全部刪除。
    • 外表
    外表用 CREATE EXTERNAL TABLE 創建,外表中的數據可以保存在HDFS的一個指定路徑上(和LOCATION <hdfs_path> 合用)。Inceptor對外表沒有所有權。用DROP 刪除外部表時,Inceptor刪除表在metastore中的元數據而不刪除表中數據,也就是說 DROP 僅僅解除Inceptor對外表操作的權利。
    • 存儲格式
    Ø TEXT表、ORC表、CSV表和Holodesk表
    v TEXT表
文本格式的表,統計和查詢性能都比較低,也不支持事務處理,所以通常用於將文本文件中的原始數據導入Inceptor中。針對不同的使用場景,用戶可以將其中的數據放入ORC表或Holodesk表中。
Inceptor提供兩種方式將文本文件中的數據導入TEXT表中:
    1. 建外部TEXT表,讓該表指向HDFS上的一個目錄,Inceptor會將目錄下文件中的數據都導入該表。(推薦)
    2. 建TEXT表(外表內表皆可)後將本地或者HDFS上的一個文件或者一個目錄下的數據 LOAD 進該表。這
種方式在安全模式下需要多重認證設置,極易出錯,星環科技 不推薦 使用這個方式導數據。

    v CSV表
CSV表的數據來源爲CSV格式(Comma-Separated Values)的文件。文件以純文本形式存儲表格數據(數
字和文本),CSV文件由任意數目的記錄組成,記錄間以某種換行符分隔;每條記錄由字段組成,字段間
的分隔符是其它字符或字符串,最常見的是逗號或製表符。通常,所有記錄都有完全相同的字段序列。
和TEXT表相似,CSV表常用於向Inceptor中導入原始數據,然後針對不同場景,用戶可以將其中的數據放入ORC表或Holodesk表中
星環科技 不建議在任何計算場景中使用CSV表

    v ORC表
ORC表即ORC格式的表。在Inceptor中,ORC表還分爲ORC事務表和非事務表。
a. ORC事務表支持事務處理和更多增刪改語法(INSERT VALUES/UPDATE/DELETE/MERGE),所
以如果您需要對錶進行事務處理,應該選擇使用ORC事務表。
b. ORC非事務表則主要用來做統計分析。

    v Holodesk表
Holodesk表存儲在內存或者SSD中(可以根據您的需要設置),同時,星環科技爲其提供了一系列優化工
具,使得在Holodesk表上進行大批量複雜查詢能達到極高的性能。所以,如果您的數據量特別大,查詢
非常複雜,您應該選擇使用Holodesk表。

    Ø Inceptor與Oracle的數據類型對應表
Oracle     Inceptor
CHAR     Char
VARCHAR     Varchar2
NCHAR     Char
Varchar2     Varchar2
NVarchar2     Varchar2
Number(p,s)     Number(p,s)
Number     Number
Number(p)     Number(p)
Decimal     Decimal
Bit     Boolean
Boolean     Boolean
SmallInt     Decimal(38,0)
Integer     Decimal(38,0)
Long     Binary
Long Raw     Binary
Raw     Binary
Float     N/A,可用Decimal(p,s)代替
BinaryFloat     Float
Double     N/A,可用Decimal(p,s)代替
BinaryDouble     Double
CLOB     CLOB
NCLOB     CLOB
BLOB     BLOB
BFile     N/A. 可以用Binary代替使用
Date     Date
Timestamp     Timestamp
Timestamp With Timezone     N/A
Timestamp with Local Timezone     N/A
Interval Year To Month     Interval Year To Month
Interval Day To Second     Interval Day To Second
Struct     Struct
Array     Array
RowId     N/A
URowId     N/A

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章