SQL Server 2005教程:如何創建修改分區表和如何查看分區表(經典)

    SQL Server 2005是微軟在推出SQL Server 2000後時隔五年推出的一個數據庫平臺,它的數據庫引擎爲關係型數據和結構化數據提供了更安全可靠的存儲功能,使用戶可以構建和管理用於業務的高可用和高性能的數據應用程序。此外SQL Server 2005結合了分析、報表、集成和通知功能。這使企業可以構建和部署經濟有效的BI解決方案,幫助團隊通過記分卡、Dashboard、Web Services和移動設備將數據應用推向業務的各個領域。無論是開發人員、數據庫管理員、信息工作者還是決策者,SQL Server 2005都可以提供出創新的解決方案,並可從數據中獲得更多的益處。

    它所帶來的新特性,如T-SQL的增強、數據分區、服務代理和與.Net Framework的集成等,在易管理性、可用性、可伸縮性和安全性等方面都有很大的增強。

    SQL Server 2005表分區的具體實現方法

    表分區分爲水平分區和垂直分區。水平分區將表分爲多個表。每個表包含的列數相同,但是行更少。例如,可以將一個包含十億行的表水平分區成 12 個表,每個小表表示特定年份內一個月的數據。任何需要特定月份數據的查詢只需引用相應月份的表。而垂直分區則是將原始表分成多個只包含較少列的表。水平分區是最常用分區方式,本文以水平分區來介紹具體實現方法。

    水平分區常用的方法是根據時期和使用對數據進行水平分區。例如本文例子,一個短信發送記錄表包含最近一年的數據,但是隻定期訪問本季度的數據。在這種情況下,可考慮將數據分成四個區,每個區只包含一個季度的數據。

    創建文件組

    建立分區表先要創建文件組,而創建多個文件組主要是爲了獲得好的 I/O 平衡。一般情況下,文件組數最好與分區數相同,並且這些文件組通常位於不同的磁盤上。每個文件組可以由一個或多個文件構成,而每個分區必須映射到一個文件組。一個文件組可以由多個分區使用。爲了更好地管理數據(例如,爲了獲得更精確的備份控制),對分區表應進行設計,以便只有相關數據或邏輯分組的數據位於同一個文件組中。使用 ALTER DATABASE,添加邏輯文件組名:

    ALTER DATABASE [DeanDB] ADD FILEGROUP [FG1]

    DeanDB爲數據庫名稱,FG1文件組名。創建文件組後,再使用 ALTER DATABASE 將文件添加到該文件組中:

    ALTER DATABASE [DeanDB] ADD FILE ( NAME = N'FG1', FILENAME = N'C:DeanDataFG1.ndf' , SIZE = 3072KB , FILEGROWTH = 1024KB ) TO FILEGROUP [FG1]

    類似的建立四個文件和文件組,並把每一個存儲數據的文件放在不同的磁盤驅動器裏。

    創建分區函數

    創建分區表必須先確定分區的功能機制,表進行分區的標準是通過分區函數來決定的。創建數據分區函數有RANGE “LEFT | / RIGHT”兩種選擇。代表每個邊界值在局部的哪一邊。例如存在四個分區,則定義三個邊界點值,並指定每個值是第一個分區的上邊界 (LEFT) 還是第二個分區的下邊界 (RIGHT)[1]。代碼如下:

    CREATE PARTITION FUNCTION [SendSMSPF](datetime) AS RANGE RIGHT FOR VALUES ('20070401', '20070701', '20071001')

    創建分區方案

    創建分區函數後,必須將其與分區方案相關聯,以便將分區指向至特定的文件組。就是定義實際存放數據的媒體與各數據塊的對應關係。多個數據表可以共用相同的數據分區函數,一般不共用相同的數據分區方案。可以通過不同的分區方案,使用相同的分區函數,使不同的數據表有相同的分區條件,但存放在不同的媒介上。創建分區方案的代碼如下:

    CREATE PARTITION SCHEME [SendSMSPS] AS PARTITION [SendSMSPF] TO ([FG1], [FG2], [FG3], [FG4])

    創建分區表

    建立好分區函數和分區方案後,就可以創建分區表了。分區表是通過定義分區鍵值和分區方案相聯繫的。插入記錄時,SQL SERVER會根據分區鍵值的不同,通過分區函數的定義將數據放到相應的分區。從而把分區函數、分區方案和分區表三者有機的結合起來。創建分區表的代碼如下:

  CREATE TABLE SendSMSLog

  ([ID] [int] IDENTITY(1,1) NOT NULL,

  [IDNum] [nvarchar](50) NULL,

  [SendContent] [text] NULL

  [SendDate] [datetime] NOT NULL,

  ) ON SendSMSPS(SendDate)

    查看分區表信息

    系統運行一段時間或者把以前的數據導入分區表後,我們需要查看數據的具體存儲情況,即每個分區存取的記錄數,那些記錄存取在那個分區等。我們可以通過$partition.SendSMSPF來查看,代碼如下:

  SELECT $partition.SendSMSPF(o.SendDate)

  AS [Partition Number]

  , min(o.SendDate) AS [Min SendDate]

  , max(o.SendDate) AS [Max SendDate]

  , count(*) AS [Rows In Partition]

  FROM dbo.SendSMSLog AS o

  GROUP BY $partition.SendSMSPF(o.SendDate)

  ORDER BY [Partition Number]  

    維護分區

    分區的維護主要設計分區的添加、減少、合併和在分區間轉換。可以通過ALTER PARTITION FUNCTION的選項SPLIT,MERGE和ALTER TABLE的選項SWITCH來實現。SPLIT會多增加一個分區,而MEGRE會合並或者減少分區,SWITCH則是邏輯地在組間轉換分區。

    性能對比

    我們對2650萬數據,存儲空間佔用約4G的單表進行性能對比,測試環境爲IBM365,CPU 至強2.7G*2、內存 16G、硬盤 136G*2,系統平臺爲Windows 2003 SP1+SQL Server 2005 SP1。測試結果如表1:

  表1:分區和未分區性能對比表(單位:毫秒)

  測試項目 分區 未分區

  1 16546 61466

  2 13 33

  3 20140 61546

  4 17140 61000

  說明:

  1:根據時間檢索某一天記錄所耗時間

  2:單條記錄插入所耗時間

  3:根據時間刪除某一天記錄所耗時間

  4:統計每月的記錄數所需時間

    從表1可以看出,對分區表進行操作比未分區的表要快,這是因爲對分區表的操作採用了CPU和I/O的並行操作,檢索數據的數據量也變小了,定位數據所耗時間變短。

發佈了39 篇原創文章 · 獲贊 19 · 訪問量 61萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章