TPC-DS介绍

参考文章:TPC-DS介绍

TPC-DS介绍

TPC-DS是一个面向决策支持系统(decision support system)的包含多维度常规应用模型的决策支持基准,包括查询(queries)与数据维护。此基准对被测系统(System Under Test’s, SUT)在决策支持系统层面上的表现进行的评估具有代表性。

此基准体现决策支持系统以下特性:

  1. 测试大规模数据
  2. 对实际商业问题进行解答
  3. 执行需求多样或复杂的查询(如临时查询,报告,迭代OLAP,数据挖掘)
  4. 以高CPU和IO负载为特征
  5. 通过数据库维护对OLTP数据库资源进行周期同步
  6. 解决大数据问题,如关系型数据库(RDBMS),或基于Hadoop/Spark的系统

基准结果用来测量,较为复杂的多用户决策中,单一用户模型下的查询响应时间,多用户模型下的查询吞吐量,以及数据维护表现。

TPC-DS vs TPC-H

TPC-DS测试基准是TPC组织推出的用于替代TPC-H的下一代决策支持系统测试基准
TPC-DS在健壮行方面要好很多,因为它的SQL本身比较复杂,
也比较多,Hack起来相对困难,并且只hack几个SQL对整体性能提高有限
 …………………………………………………………………………
TPC-H: 
     TPC-H是一款面向商品零售业的决策支持系统测试基准,
     它定义了8张表,22个查询,遵循SQL92
…………………………………………………………………………
TPC-DS:
     TPC-DS采用星型、雪花型等多维数据模式。
     它包含7张事实表,17张纬度表平均每张表含有18列。
     其工作负载包含99个SQL查询,覆盖SQL99和2003的核心部分以及OLAP。
     这个测试集包含对大数据集的统计、报表生成、联机查询、数据挖掘等复杂应用,
        测试用的数据和值是有倾斜的,与真实数据一致。
        可以说TPC-DS是与真实场景非常接近的一个测试集,也是难度较大的一个测试集。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章