阿里雲Big Data - dataworks和dataphin兩款產品的區別

區別1:產品功能不同

1、Dataworks,在阿里集團內部爲大家所熟知的部分是D2,在阿里雲則是數加平臺的主體-數據工廠。DataWorks(數據工場)具備全棧數據研發能力(數據集成與開發、 生產運維調度、離線與實時分析、數據質量治理與資產管理、安全防護、數據共享與服務、機器學習、數據應用搭建)的大數據平臺;
2、Dataphin,通過輸出阿里數據中臺實戰沉澱的大數據建設體系OneData+OneID +OneService(產品+技術+方法論),一站式提供集數據引入、規範定義、數據建模、數據研發、數據萃取的全鏈路智能數據構建及管理服務。 
一句話總結:  DataWorks具備全棧數據研發能力和機器學習開發能力的大數據平臺,這是dataworks的優勢,劣勢就是不具備數據中臺(數據倉庫)建設方法論的指導Dataphin具備完善的“OneData+OneID +OneService(產品+技術+方法論)” 數據中臺(數據倉庫)建設方法論構建體系,這是dataphih的最大優勢,劣勢就是不具備很強的全棧數據研發能力,暫時也不具備機器學習開發能力

區別2:產品定位不同

1、Dataworks 定位爲大數據開發平臺,ETL、數據倉庫建設等對開發者不做任何限制。開發者可以利用dataworks做任意想做的工作,數據中臺(數據倉庫)構建的方法論也不做任何限制。開發者可以利用dataworks,既可以按照維度建模理論構建數據中臺(數據倉庫)、也可以按照範氏建模理論構建數據中臺(數據倉庫)、也可以按照E/R理論構建數據中臺(數據倉庫),靈活性是dataworks的優勢之一,當然也是劣勢之一。因爲缺乏數據中臺(數據倉庫)建設方法論的支持,dataworks對於缺乏數據中臺建設方法論經驗的開發者(或者企業)不夠簡單易用;
2、Dataphin 定位於輸出阿里巴巴數據中臺方法論,開發者嚴格按照基於阿里多年零售經驗的維度建模理論構建數據中臺(數據倉庫)。“設計即開發”,這是dataphin堅持的核心理念,使用dataphin的時候,開發者需要嚴格定義業務板塊、數據域、業務過程、維度、原子指標、派生指標,然後“傻瓜式”地構建數據中臺(數據倉庫)開發者可能都不用寫任何代碼(甚至連sql都可能不用寫),只要按照上述維度建模方法論完成所有設計,即可構建數據中臺(數據倉庫)----

區別3:實時計算能力

不論是dataworks還是dataphin,均定位於離線批量開發能力。對於實時計算能力的支持,dataworks比dataphin稍微更強一些。利用dataworks集成的datahub+flink等工具能力,能夠實現一些簡單應用場景的實時計算能力; dataphin也在規劃實時計算能力,預計再過幾個月,dataphin最新版本也能實現一些簡單場景的實時計算能力。

【總結】

1、如果開發者(或者企業)希望傻瓜式的構建數據中臺(數據倉庫),而且是借鑑阿里基於零售業務積累的“OneData+OneID +OneService”方法論構建維度建模體系的數據中臺,那麼dataphin是不錯的選擇
2、如果開發者(或者企業)希望購買一套全棧數據研發能力的大數據平臺,涵蓋完善的數據集成與開發、生產運維調度、離線與實時分析、數據質量治理與資產管理、安全防護、數據共享與服務、機器學習、數據微服務應用搭建等能力。而且數據中臺(數據倉庫)不限制於維度建體系,那麼dataworks是不錯的選擇。

 

dataphin有完整的數據模型設計,dataworks沒有。

dataphin有體系化的數據指標管理,dataworks沒有。

dataphin有數據萃取,核心實體的標籤構建與管理,dataworks沒有。

dataphin有基於邏輯模型的語義的OneService能力,dataworks沒有。

dataphin有靈活自助的數據資產治理能力,dataworks沒有。

dataworks有SQL編輯器,dataphin有。

dataworks有圖形化的調度平臺,dataphin有。

dataworks有數據地圖,dataphin有。

dataworks有數據質量管理,dataphin有。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章