PowerBI 開發 第23篇:共享數據集

Power BI共享數據集的優點是:只要數據集刷新,那麼引用該數據集的報表都會自動刷新,節省了報表數據刷新的時間和算力,缺點是:使用共享數據集的報表,雖然可以新增Measure(Measure僅存在於本地報表中,不會同步到共享dataset),但是無法修改數據模型,比如,無法修改關係,不能創建計算列,不能查看共享Measure的定義等,這導致報表開發的自由度受到限制。

一,什麼是共享數據集?

在Power BI Service中,任何一個Report都由兩部分構成:Report (可視化圖表)和Dataset(數據集),兩者的關係是:可視化圖表引用數據集的數據,並以一定的UI顯示數據。

當使用Power BI Desktop IDE進行報表開發時,可能會誤以爲報表和數據是一體的。雖然不會輕易的看到分開的Report和數據集,但是,只需要你打開Task Manager,在PowerBI Desktop進程下面存在Microsoft SQL Server Analysis Service,這就是報表的數據集部分,而Microsoft Power BI Desktop就是報表的可視化設計部分。

當把報表(PBIX文件)發佈到Power BI Service之後,我們就能很容易看到報表是由report和dataset兩部分構成的:

  • report 是報表的可視化實現,主要是由圖表及其佈局構成
  • dataset 主要包括數據表,數據字段的格式,關係(relationships),度量(Measure),計算列(calculated column)和連接(connection to the data source)等構成

例如,Alignment Report報表,在Workspaces中查看到兩個同名的Name,但是Type不同:

如果多個Report共用一個Dataset,那麼這個Dataset就是共享數據集。每當Dataset刷新後,任何引用這個Dataset的Report都會自動刷新,這也是共享數據集的優點。

共享數據集的一個重要作用,是把後端(建立數據集)的任務從整個報表開發流程中分離出來,後端只需要把精力集中在數據查詢,模型關聯等跟數據處理有關的工作上,而前端只需要把精力集中在DAX表達式和可視化的設計上,這對於BI團隊的分工協作有重要意義。

二,如何創建共享數據集

任何Power BI dataset都可以是共享數據集,創建共享數據集的方法非常簡單,只需要把PBIX文件發佈到Power BI Service中,當發佈成功之後,這個Dataset就可以作爲共享數據集。

三,如何連接共享數據集

連接共享數據集的操作也是十分簡單,在Power BI Desktop中新建一個報表,從Data hub中點擊 Power BI datasets,並從datasets列表中選擇合適的dataset,點擊"Connect",開始連接共享數據集。

當連接到共享數據集之後,就可以使用dataset來進行可視化設計。報表和數據集之間的連接是Live Connection,Online 報表(已經發布到Power BI Service的report)的查詢性能跟數據集是否共享沒有關係,如果共享數據集使用Import方式連接數據源,那麼引用共享數據集的報表的查詢性能是非常快的。報表可以創建報表級別的Measure,但是建模會受到限制,數據模型只能在原始數據集中進行修改。

在Power BI Desktop中開發report時,report UI是local的,而共享dataset是online的,查詢性能受到網絡的影響,這也是Live Connection的特點。

 

參考文檔:

Power BI Shared Datasets: What is it? How does it work? and Why should you care?

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章