監控 SQL Server 的運行狀況

Microsoft SQL Server 2005 提供了一些工具來監控數據庫。方法之一是動態管理視圖。動態管理視圖 (DMV) 和動態管理函數 (DMF) 返回的服務器狀態信息可用於監控服務器實例的運行狀況、診斷問題和優化性能。

常規服務器動態管理對象包括:

  • dm_db_*:數據庫和數據庫對象

  • dm_exec_*:執行用戶代碼和關聯的連接

  • dm_os_*:內存、鎖定和時間安排

  • dm_tran_*:事務和隔離

  • dm_io_*:網絡和磁盤的輸入/輸出

此部分介紹爲監控 SQL Server 運行狀況而針對這些動態管理視圖和函數運行的一些常用查詢。

示例查詢

您可以運行以下查詢來獲取所有 DMV 和 DMF 名稱:

SELECT * FROM sys.system_objects
WHERE name LIKE 'dm_%'
ORDER BY name

監控 CPU 瓶頸

CPU 瓶頸通常由以下原因引起:查詢計劃並非最優、配置不當、設計因素不良或硬件資源不足。下面的常用查詢可幫助您確定導致 CPU 瓶頸的原因。

下面的查詢使您能夠深入瞭解當前緩存的哪些批處理或過程佔用了大部分 CPU 資源。

複製代碼
SELECT TOP 50 
SUM(qs.total_worker_time) AS total_cpu_time,
SUM(qs.execution_count) AS total_execution_count,
COUNT(*) AS number_of_statements,
qs.sql_handle
FROM sys.dm_exec_query_stats AS qs
GROUP BY qs.sql_handle
ORDER BY SUM(qs.total_worker_time) DESC
複製代碼

下面的查詢顯示緩存計劃所佔用的 CPU 總使用率(帶 SQL 文本)。

複製代碼
SELECT 
total_cpu_time,
total_execution_count,
number_of_statements,
s2.text
--(SELECT SUBSTRING(s2.text, statement_start_offset / 2, ((CASE WHEN statement_end_offset = -1 THEN (LEN(CONVERT(NVARCHAR(MAX), s2.text)) * 2) ELSE statement_end_offset END) - statement_start_offset) / 2) ) AS query_text
FROM
(SELECT TOP 50
SUM(qs.total_worker_time) AS total_cpu_time,
SUM(qs.execution_count) AS total_execution_count,
COUNT(*) AS number_of_statements,
qs.sql_handle --,
--MIN(statement_start_offset) AS statement_start_offset,
--MAX(statement_end_offset) AS statement_end_offset
FROM
sys.dm_exec_query_stats AS qs
GROUP BY qs.sql_handle
ORDER BY SUM(qs.total_worker_time) DESC) AS stats
CROSS APPLY sys.dm_exec_sql_text(stats.sql_handle) AS s2
複製代碼

下面的查詢顯示 CPU 平均佔用率最高的前 50 個 SQL 語句。

複製代碼
SELECT TOP 50
total_worker_time/execution_count AS [Avg CPU Time],
(SELECT SUBSTRING(text,statement_start_offset/2,(CASE WHEN statement_end_offset = -1 then LEN(CONVERT(nvarchar(max), text)) * 2 ELSE statement_end_offset end -statement_start_offset)/2) FROM sys.dm_exec_sql_text(sql_handle)) AS query_text, *
FROM sys.dm_exec_query_stats
ORDER BY [Avg CPU Time] DESC
複製代碼

下面顯示用於找出過多編譯/重新編譯的 DMV 查詢。

select * from sys.dm_exec_query_optimizer_info
where
counter = 'optimizations'
or counter = 'elapsed time'

下面的示例查詢顯示已重新編譯的前 25 個存儲過程。plan_generation_num 指示該查詢已重新編譯的次數。

複製代碼
select top 25
sql_text.text,
sql_handle,
plan_generation_num,
execution_count,
dbid,
objectid
from sys.dm_exec_query_stats a
cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc
複製代碼

效率較低的查詢計劃可能增大 CPU 佔用率。

下面的查詢顯示哪個查詢佔用了最多的 CPU 累計使用率。

複製代碼
SELECT 
highest_cpu_queries.plan_handle,
highest_cpu_queries.total_worker_time,
q.dbid,
q.objectid,
q.number,
q.encrypted,
q.[text]
from
(select top 50
qs.plan_handle,
qs.total_worker_time
from
sys.dm_exec_query_stats qs
order by qs.total_worker_time desc) as highest_cpu_queries
cross apply sys.dm_exec_sql_text(plan_handle) as q
order by highest_cpu_queries.total_worker_time desc
複製代碼

下面的查詢顯示一些可能佔用大量 CPU 使用率的運算符(例如 ‘%Hash Match%’、‘%Sort%’)以找出可疑對象。

複製代碼
select *
from
sys.dm_exec_cached_plans
cross apply sys.dm_exec_query_plan(plan_handle)
where
cast(query_plan as nvarchar(max)) like '%Sort%'
or cast(query_plan as nvarchar(max)) like '%Hash Match%'
複製代碼

如果已檢測到效率低下並導致 CPU 佔用率較高的查詢計劃,請對該查詢中涉及的表運行 UPDATE STATISTICS 以查看該問題是否仍然存在。然後,收集相關數據並將此問題報告給 PerformancePoint 規劃支持人員。

如果您的系統存在過多的編譯和重新編譯,可能會導致系統出現與 CPU 相關的性能問題。

您可以運行下面的 DMV 查詢來找出過多的編譯/重新編譯。

select * from sys.dm_exec_query_optimizer_info
where
counter = 'optimizations'
or counter = 'elapsed time'

下面的示例查詢顯示已重新編譯的前 25 個存儲過程。plan_generation_num 指示該查詢已重新編譯的次數。

複製代碼
select top 25
sql_text.text,
sql_handle,
plan_generation_num,
execution_count,
dbid,
objectid
from sys.dm_exec_query_stats a
cross apply sys.dm_exec_sql_text(sql_handle) as sql_text
where plan_generation_num > 1
order by plan_generation_num desc
複製代碼

如果已檢測到過多的編譯或重新編譯,請儘可能多地收集相關數據並將其報告給規劃支持人員。

內存瓶頸

開始內存壓力檢測和調查之前,請確保已啓用 SQL Server 中的高級選項。請先對 master 數據庫運行以下查詢以啓用此選項。

sp_configure 'show advanced options'
go
sp_configure 'show advanced options', 1
go
reconfigure
go

首先運行以下查詢以檢查內存相關配置選項。

複製代碼
sp_configure 'awe_enabled'
go
sp_configure 'min server memory'
go
sp_configure 'max server memory'
go
sp_configure 'min memory per query'
go
sp_configure 'query wait'
go
複製代碼

運行下面的 DMV 查詢以查看 CPU、計劃程序內存和緩衝池信息。

複製代碼
select 
cpu_count,
hyperthread_ratio,
scheduler_count,
physical_memory_in_bytes / 1024 / 1024 as physical_memory_mb,
virtual_memory_in_bytes / 1024 / 1024 as virtual_memory_mb,
bpool_committed * 8 / 1024 as bpool_committed_mb,
bpool_commit_target * 8 / 1024 as bpool_target_mb,
bpool_visible * 8 / 1024 as bpool_visible_mb
from sys.dm_os_sys_info
複製代碼

I/O 瓶頸

檢查閂鎖等待統計信息以確定 I/O 瓶頸。運行下面的 DMV 查詢以查找 I/O 閂鎖等待統計信息。

select wait_type, waiting_tasks_count, wait_time_ms, signal_wait_time_ms, wait_time_ms / waiting_tasks_count
from sys.dm_os_wait_stats
where wait_type like 'PAGEIOLATCH%' and waiting_tasks_count > 0
order by wait_type

如果 waiting_task_counts 和 wait_time_ms 與正常情況相比有顯著變化,則可以確定存在 I/O 問題。獲取 SQL Server 平穩運行時性能計數器和主要 DMV 查詢輸出的基線非常重要。

這些 wait_types 可以指示您的 I/O 子系統是否遇到瓶頸。

使用以下 DMV 查詢來查找當前掛起的 I/O 請求。請定期執行此查詢以檢查 I/O 子系統的運行狀況,並隔離 I/O 瓶頸中涉及的物理磁盤。

複製代碼
select 
database_id,
file_id,
io_stall,
io_pending_ms_ticks,
scheduler_address
from sys.dm_io_virtual_file_stats(NULL, NULL)t1,
sys.dm_io_pending_io_requests as t2
where t1.file_handle = t2.io_handle
複製代碼

在正常情況下,該查詢通常不返回任何內容。如果此查詢返回一些行,則需要進一步調查。

您還可以執行下面的 DMV 查詢以查找 I/O 相關查詢。

複製代碼
select top 5 (total_logical_reads/execution_count) as avg_logical_reads,
(total_logical_writes/execution_count) as avg_logical_writes,
(total_physical_reads/execution_count) as avg_physical_reads,
Execution_count, statement_start_offset, p.query_plan, q.text
from sys.dm_exec_query_stats
cross apply sys.dm_exec_query_plan(plan_handle) p
cross apply sys.dm_exec_sql_text(plan_handle) as q
order by (total_logical_reads + total_logical_writes)/execution_count Desc
複製代碼

下面的 DMV 查詢可用於查找哪些批處理/請求生成的 I/O 最多。如下所示的 DMV 查詢可用於查找可生成最多 I/O 的前五個請求。調整這些查詢將提高系統性能。

複製代碼
select top 5 
(total_logical_reads/execution_count) as avg_logical_reads,
(total_logical_writes/execution_count) as avg_logical_writes,
(total_physical_reads/execution_count) as avg_phys_reads,
Execution_count,
statement_start_offset as stmt_start_offset,
sql_handle,
plan_handle
from sys.dm_exec_query_stats
order by (total_logical_reads + total_logical_writes) Desc
複製代碼

阻塞

運行下面的查詢可確定阻塞的會話。

select blocking_session_id, wait_duration_ms, session_id from 
sys.dm_os_waiting_tasks
where blocking_session_id is not null

使用此調用可找出 blocking_session_id 所返回的 SQL。例如,如果 blocking_session_id 是 87,則運行此查詢可獲得相應的 SQL。

dbcc INPUTBUFFER(87)

下面的查詢顯示 SQL 等待分析和前 10 個等待的資源。

select top 10 *
from sys.dm_os_wait_stats
--where wait_type not in ('CLR_SEMAPHORE','LAZYWRITER_SLEEP','RESOURCE_QUEUE','SLEEP_TASK','SLEEP_SYSTEMTASK','WAITFOR')
order by wait_time_ms desc

若要找出哪個 spid 正在阻塞另一個 spid,可在數據庫中創建以下存儲過程,然後執行該存儲過程。此存儲過程會報告此阻塞情況。鍵入 sp_who 可找出 @spid;@spid 是可選參數。

複製代碼
create proc dbo.sp_block (@spid bigint=NULL)
as
select
t1.resource_type,
'database'=db_name(resource_database_id),
'blk object' = t1.resource_associated_entity_id,
t1.request_mode,
t1.request_session_id,
t2.blocking_session_id
from
sys.dm_tran_locks as t1,
sys.dm_os_waiting_tasks as t2
where
t1.lock_owner_address = t2.resource_address and
t1.request_session_id = isnull(@spid,t1.request_session_id)
複製代碼

以下是使用此存儲過程的示例。

exec sp_block
exec sp_block @spid = 7
 
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章