TPC-H測試數據表生成

1.下載TPCH生成工具

官方網址:http://www.tpc.org/tpc_documents_current_versions/current_specifications.asp

本文中安裝的是:
TPC-H 2.17.3

2.安裝TPCH生成工具

下載完成後,解壓
在這裏插入圖片描述

3.生成指定的數據庫文件

(1) 創建makefile文件並編輯具體參數

[pcc@localhost 2.17.3]$ cd ./dbgen/
[pcc@localhost dbgen]$ cp makefile.suite makefile
[pcc@localhost dbgen]$ vim makefile

將其內容修改爲如下圖所示

CC = gcc
DATABASE = DB2
MACHINE = LINUX
WORKLOAD = TPCH

在這裏插入圖片描述

(2) 執行make

[pcc@localhost dbgen]$ make
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o build.o build.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o driver.o driver.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o bm_utils.o bm_utils.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o rnd.o rnd.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o print.o print.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o load_stub.o load_stub.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o bcd2.o bcd2.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o speed_seed.o speed_seed.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o text.o text.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o permute.o permute.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o rng64.o rng64.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64  -O -o dbgen build.o driver.o bm_utils.o rnd.o print.o load_stub.o bcd2.o speed_seed.o text.o permute.o rng64.o -lm
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o qgen.o qgen.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64    -c -o varsub.o varsub.c
gcc  -g -DDBNAME=\"dss\" -DLINUX -DDB2 -DTPCH -DRNG_TEST -D_FILE_OFFSET_BITS=64  -O -o qgen build.o bm_utils.o qgen.o rnd.o varsub.o text.o bcd2.o permute.o speed_seed.o rng64.o -lm

(3) 生成指定大小的數據

[pcc@localhost dbgen]$ ./dbgen -s 5
TPC-H Population Generator (Version 2.17.3)
Copyright Transaction Processing Performance Council 1994 - 2010

[pcc@localhost dbgen]$ ls -alh | grep
Usage: grep [OPTION]... PATTERN [FILE]...
Try `grep --help' for more information.
[pcc@localhost dbgen]$ ls -alh | grep tbl
-rw-rw-r--. 1 pcc pcc 117M Jan  3 11:04 customer.tbl
-rw-rw-r--. 1 pcc pcc 3.6G Jan  3 11:04 lineitem.tbl
-rw-rw-r--. 1 pcc pcc 2.2K Jan  3 11:04 nation.tbl
-rw-rw-r--. 1 pcc pcc 830M Jan  3 11:04 orders.tbl
-rw-rw-r--. 1 pcc pcc 573M Jan  3 11:04 partsupp.tbl
-rw-rw-r--. 1 pcc pcc 116M Jan  3 11:04 part.tbl
-rw-rw-r--. 1 pcc pcc  389 Jan  3 11:04 region.tbl
-rw-rw-r--. 1 pcc pcc 6.8M Jan  3 11:04 supplier.tbl

生成結束後,就能在dbgen文件夾下面看到生成的數據集了。生成5GB的數據時,orders表大小爲870.2MB,lineitem表大小爲3.9GB
在這裏插入圖片描述

發佈了52 篇原創文章 · 獲贊 44 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章