層次數據集--解決報表中關聯計算性能低下的好幫手

更多性能方面的解決方案請參考原文出處:http://c.raqsoft.com.cn/article/1552916735001?r=CGQ

 

多層次報表的性能優化方案

性能優化(8) 多層次報表(1) 主子表(1) 腳本(23)

多層次報表是常見的報表形式,典型的如分組報表和主子報表。其中的關聯運算(組與明細、主表和子表)由於有層次而不能直接在數據庫中完成,需要在報表端完成。而報表端一般只能採用排序和遍歷的方法實現關聯,性能又比較差。

本文介紹的潤乾報表可以利用層次數據集(需要結合集算器實現)在數據源計算過程中完成關聯計算,並且將有層次的結果集直接傳送給報表進行呈現,從而做到在關聯計算中充分利用集算器的高效算法,達到優化性能的目標。

下面通過一個主子報表的實例看一下使用過程與效果。

報表描述

使用訂單表和訂單明細表,查詢每個訂單詳情以及該訂單下的訂單明細,報表格式如下:

imagepng

環境及數據描述

測試機型:Dell Inspiron 3420

CPU:Intel Core i5-3210M @2.50GHz *4

RAM:4G

HDD:西數 WDC(500G 5400 轉 / 分)

操作系統:Win7(X64) SP1

JDK:1.6

數據庫:hsqldb

潤乾報表版本:2018

表數據

表名 字段數   數據量
訂單表 15   854
訂單明細表 5   434315

實現步驟

編寫計算腳本

首先使用集算器(專門用於數據計算,爲報表提供數據源支持的工具)編寫計算腳本(orders.dfx),完成數據計算並返回層次數據集。

  A
1 =connect(“demo”)
2 =A1.query(“select 訂單 ID, 訂單編號, 發貨日期, 到貨日期, 客戶 ID, 貨主名稱, 運貨商, 運貨費, 貨主城市 from 訂單”)
3 =A1.query@x(“select * from 訂單明細”)
4 >A2.run(訂單編號 =A3.select( 訂單 ID==A2. 訂單編號))
5 return A2.select(訂單編號!=[])

A1:連接數據源;

A2-A3:分別查詢訂單和訂單明細表數據;

A4:根據訂單編號關聯訂單和訂單明細表;

A5:報表返回訂單編號不爲空的結果集。

編制報表

新建報表模板後,數據集選擇“集算器”,在數據集編輯窗口指定上述編輯好的 dfx 文件,完成數據集創建。

報表中層次數據集效果

imagepng

設置報表模板表達式:

imagepng

不同於在報表中關聯,使用層次數據集可通過集算腳本返回的單個結果集完成主子報表的製作,從而獲得了更高的性能。爲了對比,下面看一下在報表中直接關聯的實現方式:

不使用層次數據集實現

數據集

ds1: select 訂單 ID, 訂單 ID 訂單編號, 發貨日期, 到貨日期, 客戶 ID, 貨主名稱, 運貨商, 運貨費, 貨主城市 from 訂單

ds2: select * from 訂單明細

報表模板

imagepng

效果對比

下表對比了使用層次數據集前後的時間開銷,單位爲秒。

imagepng

可以看到,使用層次數據集帶來了明顯的效果提升。這是因爲在單元格中完成主子表的關聯,只能使用遍歷算法(針對單條主記錄去尋找關聯的子記錄),因此效率不高。而集算器採用了更高效的 hash 關聯方案,事先將所有子記錄按 hash 代碼對應到主記錄上(代碼中的 run 函數, 速度比遍歷快 5-10 倍),使得主子表的數據源準備(數據計算)效率大大提升,從而可以獲得更高的整體運算性能。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章