MaxCompute2.0更新對數據倉庫教學的影響

因爲之前在學校授課過程中講授數據倉庫課程時是通過MaxCompute來進行講解的,因此針對這次MaxCompute2.0的升級,在我在教學中也對課程內容同樣進行了升級,這裏針對主要的升級點進行一些說明。
針對數據科學與大數據技術專業的學生來說,數據倉庫應該算是他們必須要掌握的技能之一,而開源數據倉庫環境搭建對本地系統要求很高,同時企業中關注的也不是環境搭建而是基於數據倉庫的數據分析和數據處理,因此在這門課程的設計中,我們通過使用MaxCompute來替代本地搭建Hive作爲學生的學習和實驗環境,以保證所有學生都能夠有一個穩定的實驗環境。
本次更新影響相對比較大的點主要有:

1、開發環境與生產環境的問題,因爲之前版本中開發環境和生產環境並沒有這次這麼明確的區分,因此更新後很多學生在學習和使用時發現找不到自己建立的表,原因就是沒有注意查找的是開發環境還是生產環境。當然明確區分開發和生產環境這是很好的設計,但是建議在相對更明顯的地方提供切換開發生產環境的按鈕與標識,方便用戶來查看與切換。
2、新增業務流程和解決方案:業務流程與之前的工作流功能類似,算是一個升級版,節點圖標優化的比較好,方便查看和管理,而且可以很方便的通過解決方案查看和導入機器學習PAI中準備好的算法模型

因爲在授課中主要講解數據倉庫的基礎知識,以及讓學生基於現有系統自行設計數據倉庫各層的架構,並完成ETL,因此通過MaxCompute的流程管理就很容易直觀的讓學生感受到處理過程。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章