分區表是指在創建表時指定分區空間,即指定表內的某幾個字段作爲分區列。分區表實際就是對應分佈式文件系統上的的獨立的文件夾,該文件夾下是該分區所有數據文件。而分區可以理解爲分類,通過分類把不同類型的數據放到不同的目錄下。分類的標準就是分區字段,可以是一個,也可以是多個。
分區表的意義在於優化查詢。查詢表時通過where字句查詢指定所需查詢的分區,避免全表掃描,提高處理效率,降低計算費用。
MaxCompute將分區列的每個值作爲一個分區(目錄),您可以指定多級分區,即將表的多個字段作爲表的分區,分區之間如多級目錄的關係。
使用數據時,如果指定需要訪問的分區名稱,則只會讀取相應的分區,可避免全表掃描,提高處理效率,降低費用。
分區類型
MaxCompute2.0對分區類型的支持進行了擴充,目前MaxCompute支持Tinyint、Smallint、Int、Bigint、Varchar和String分區類型。
分區使用限制
分區有以下使用限制。
- 單表分區層級最多6級。
- 單表分區數最多允許60000個分區。
- 一次查詢最多查詢分區數爲10000個分區。
- String分區類型的分區值不支持使用中文。
來源:https://help.aliyun.com/document_detail/27820.html?spm=a2c4g.11186623.4.4.7702544eiZedzV