阿里雲 MaxCompute 2020-10 月刊

【10月新功能發佈】

1、MaxCompute 支持 sort by 不帶 distribute by

MaxCompute 支持 sort by 不帶 distribute by,提供數據重排的解決方案,提高SQL執行的過濾性能。

適用客戶
開發者

發佈功能
MaxCompute 支持不帶 distribute by 的sort by,提供數據重排的解決方案,提高謂詞下推的過濾性能。當 sort by 語句前沒有 distribute by 時能夠增加

存儲壓縮率,同時讀取的時候如果有過濾,能夠利用這個信息減少真正從磁盤讀取的數據量,提高後面進行的全局排序的效率。

查看文檔 >>


2、SEMI JOIN 支持 MAPJOIN Hint

SEMI JOIN支持MAPJOIN Hint,提高 LEFT SEMI/ANTI JOIN的性能,爲數據傾斜問題提供解決方案。

適用客戶
開發者,分析師

發佈功能
當一個大表和一個或多個小表JOIN時,用戶可以在SELECT語句中顯式指定MAPJOIN Hint以提升查詢性能。目前MAPJOIN Hint進一步支持 LEFT SEMI JOIN和LEFT ANTI JOIN, 可以提高SEMI JOIN的性能,同時也爲數據傾斜問題提供解決方案。

查看文檔 >>


3、OSS外部表CSV/TSV文件支持GBK編碼格式

OSS外部表CSV/TSV文件支持GBK編碼格式。

適用客戶
開發者

發佈功能
OSS 外部表 odps.text.option.encoding 原先支持三種格式:UTF-8/UTF-16/US-ASCII,在新版本中增加了對GBK編碼格式的支持。

查看文檔 >>


4、批量 Drop Partition 支持條件篩選

使用條件表達式匹配選中的分區進行批量刪除,滿足用戶希望一次刪除符合某個規則的一個或多個分區的需求。

適用客戶
開發者、數據倉庫管理員

發佈功能
支持條件篩選方式刪除分區。如果用戶希望一次性刪除符合某個規則條件的一個或多個分區,可以使條件表達式匹配選中的分區進行批量刪除。

查看文檔 >>


5、MaxCompute 新增支持更多內置函數

新增 WIDTH_BUCKET 函數,時間函數 year/quarter/month 等對 DateTime 輸入數據類型的支持。

適用客戶
開發者、數據分析師

發佈功能
WIDTH_BUCKET函數:獲取某個字段值落入的分組編號,設定分組範圍的最小值和最大值,以及分組個數,構建指定個數的大小相同的分組,返回字段值落

入的分組編號。
時間函數 year/quarter/month/day/hour/minute/second 增加對DateTime輸入數據類型的支持 - 增加如下內建函數接口:
• INT year(datetime date)
• INT quarter(datetime date)
• INT month(datetime date)
• INT day(datetime date)
• INT hour(datetime date)
• INT minute(datetime date)
• INT second(datetime date)

查看文檔 >> 查看文檔 >>


6、MaxCompute 寫表支持Zorder by語句

增加 SQL DML的 zorder by 語句,支持把數據相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。

適用客戶
開發者、數據分析師

發佈功能
增加 SQL DML 的 zorder by 語句,支持DML語句的方式把數據相近的行排列在一起,提升查詢時的過濾性能,一定程度上降低存儲成本。

查看文檔 >>


閱讀往期月刊 >>
MaxCompute 產品官網 >>
免費下載《SaaS模式雲數據倉庫手冊》>>

更多關於大數據計算產品技術交流,可掃碼加入 “MaxCompute開發者社區” 釘釘羣
123.jpg

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章