內存使用出錯檢測--PageHeap.Exe

Windows has triggered a breakpoint in xxx.exe

看到這個錯誤就可以推測是內存使用錯了,但是這種錯誤很隱蔽。所以昨天花了一整天找到這個錯誤,最後發現是一個全局變量指針指向了一個非全局類實例的一個成員。當文檔關閉時,這個類就銷燬了,但是全局的指針還在,這個時候變成了野指針。而下一次打開文檔時接着使用了,所以異常。

pageheap.exe工具幫了不少忙,在打開它後錯誤基本就能定位到了。在沒用它之前,每次跳出異常的地方不確定,在各種new的地方都可能出現,讓人極其鬱悶。下面貼個pageheap.exe的使用說明。

 

推薦使用PageHeap.Exe和Gflags.Exe,主要的原因還是因爲當有人問內存越界的錯誤如何查出來的時候,國外的朋友經常會推薦這兩個工具(highly recommend)。我用過之後,也覺得有些時候用用還是有好處的。

PageHeap.Exe將針對某個指定的應用程序啓用Page Heap標誌,從而自動監視所有的malloc、new和heapAlloc的內存分配,找出內存錯誤。

PageHeap.Exe的下載地點:

http://download.microsoft.com/download/vc60pro/utility/6.0/win98/en-us/pageheap1.exe

下面我們簡單地給出PageHeap使用步驟:

第一步:

在命令行中運行PageHeap.Exe。如果你以前設置過啓用Global Page Heap標誌,那麼你將看到一個列表,給出所有已經啓用了的應用程序的名字,不含路徑。

如下所示:

C:\>pageheap

pgh.exe                                  enabled

testSplit.exe                            enabled


第二步:

編譯一個小程序,其中有如下代碼:

void main()
{
  int m_len = 5;
  char *m_p = (char *)HeapAlloc (GetProcessHeap (),    HEAP_ZERO_MEMORY, m_len);
  m_p[m_len] = 0;
  HeapFree (GetProcessHeap (),0, m_p);
}

Build出一個Debug版本。運行之,你看不到有任何異常的報告。

但其實m_p[m_len]=0這句話就是越界寫了,因爲只分配到了m_p[m_len-1]!這種情況就叫Dynamic memory overrun。用BoundsChecker是可以查到的。

這時,表面上看不出任何問題,但是一顆定時炸彈已經埋下了。


第三步:

在命令行中運行PageHeap /enable YourApplicationName.exe 0x01。

再運行一次不帶參數的PageHeap,察看上面的命令是否生效。你的應用程序應該在啓用的列表中。

注意:千萬不要在YourApplication.Exe前面加上路徑!!

0x01的含義在後面說明。


第四步:

再次運行你的程序。

你將會注意到在Output窗口的加載各種DLL之前,多了幾句話:

Loaded exports for 'C:\WINNT\System32\ntdll.dll'
Page heap: process 0x57C created heap @ 00130000 (00230000, flags 0x1)
Loaded 'C:\WINNT\system32\MFC42D.DLL', no matching symbolic information found.
..
Loaded 'C:\WINNT\system32\MSVCP60D.DLL', no matching symbolic information found.
Page heap: process 0x57C created heap @ 00470000 (00570000, flags 0x1)
Loaded exports for 'C:\WINNT\system32\imm32.dll'

這就是Page Heap的監視機制在發揮作用!他告訴你你的堆00470000被創建出來了。

然後程序退出後,Output窗口有這麼幾句話表明一定有什麼錯誤發生了:

Page heap: block @ 0015AFF8 is corrupted (reason 10)
Page heap: reason: corrupted suffix pattern
Page heap: process 0x57C destroyed heap @ 00471000 (00570000)
The thread 0x8A8 has exited with code 0 (0x0).

這說明在銷燬堆00470000時遇到了麻煩,就是數據塊0015AFF8被誤用了,原因是誤用了下標語法。看,說得多麼清楚!也節省了許多翻來覆去查代碼的工作!


PageHeap的使用中有幾點值得注意:

1:啓用PageHeap不能夠影響正在運行中的應用程序。如果你需要啓用一些正在運行且不能重啓的程序的PageHeap,那請運行PageHeap啓用後,重新啓動機器。

2:要想查看PageHeap把信息放到哪裏了,請打開你的註冊表,來到HKLM\SOFTWARE\Microsoft\Windows NT\CurrentVersion\Image File Execution Options

你將會看到你的應用程序也在這個項下面。你的應用程序的GlobalFlag被設置爲了0x02000000,PageHeapFlags被設置爲了0x01。

3:PageHeap的原理是這樣,它在已分配的內存的後面放上幾個守護字節(Guard Bytes),再跟上一個標記爲PAGE_NOACCESS的內存頁。這樣,已分配內存的後面如果被重寫了,那麼守護字節就會被改變,於是當內存被釋放時,PageHeap就會引發一個AV(Access Violation)。大體上就是這樣。所以只有最後釋放這塊問題內存時,纔會有PageHeap的報告!這就是PageHeap的侷限性吧。

參數0x01的含義:

FLAGS hex value (0x...) has the following structure:

    B7-B0   Bit flags    1 - enable page heap

   01 - enable page heap. If zero normal heap is used. In 99% of the cases you will want this to be set.
   02 - collect stack traces (default on checked builds)
   04 - minimize memory impact
   08 - minimize randomly(1)/based on size range(0)
   10 - catch backward overruns

看到了嗎?你還可以設置參數爲0x10,從而可以檢查內存向前的越界寫!

Gflags.Exe是微軟的Debugging Tools裏面的工具。在Windows 2000的Resource Kit中也可以找得到。我們也可以用它來完成和PageHeap相同的任務。當然,Gflags.EXE還能做許許多多其他的事情。這裏我們就不介紹了,總之物超所值。

具體的使用辦法是:

1)     運行Gflags.Exe;

2)  你將看到一個對話框。在”Image File”的編輯框中寫下你的應用程序的名字,如YourApp.Exe。注意不要路徑!

3)  選擇”Image File Options”的單選鈕;

4)  這時,你會看到對話框的內容突然一變。選中“Place heap
allocations at ends of pages”前的複選框。

5)  點擊Apply按鈕。

這樣,就達到了PageHeap的效果。現在運行你的程序,overwrite你的堆,就應該生成一個AV了!


(請結合查看微軟KB:SAMPLE: PageHeap1.exe Finds Heap Corruption and Memory Errors (Q264471))

 

其他人也遇到過這個問題,貼一些他們的分享:

過程是這樣的,在vc debug的過程中,突然彈出了一個assert窗口:

Windows has triggered a breakpoint in cs.exe.

This may be due to a corruption of the heap, which indicates a bug in cs.exe or any of the DLLs it has loaded.

This may also be due to the user pressing F12 while cs.exe has focus.

查看output輸出:

Heap missing last entry in committed range near e6****630

Windows has triggered a breakpoint in cs.exe.

This may be due to a corruption of the heap, which indicates a bug in cs.exe or any of the DLLs it has loaded.

不廢話,直接查看該內存是什麼:

0×0E6****630 0e 00 0f 00 59 03 10 04 aa aa cd ab 00 10 72 85 38 00

看不出什麼,往上再看看:

0×0E6****60C 07 e2 04 00 a8 01 66 0e 01 00 cd cd fd fd fd fd….

看來這就是塊堆內存,實在看不出什麼,決定暫時忽略. 過了幾天,該錯誤沒有再出現過.

但就在交付程序前一天測試中,又出現了這個錯誤.看來一顆定時炸彈是埋藏在了程序中.必須找出來,否則後果很嚴重.

首先要做的就是要重現這個問題,如果每次碰巧遇到這個問題的話,實在無從下手.從症狀來看,是個典型的Heap Corrupt.所以先使用工具:pageheap,以做到能夠百分百重現那個堆破壞.

page heap工具啓用的兩種方法:Full-page heap和Normal page heap

我先使用了Normal page heap 命令爲pageheap /enable xx.exe /normal

然後通過windbg設置符號表:x:\symbols_folder;srv*x:\symbols_folder*http://msdl.microsoft.com/download/symbols

開始各種調試,幾乎用遍了<>這本書中指導的各種命令,(調試過程省略2000字)未果.幾乎崩潰時,突然看到書上的這麼一段話:

普通頁堆通過填充模式檢測堆塊破壞,需要再發生堆破壞之後再調用一次堆管理器.

完全頁堆除了特定的填充模式外,它還爲每個堆塊增加了防護頁,防護頁是一個頁不可訪問的內存,它被放置在堆塊的起始位置和結束位置上.防止堆塊上下溢出.

我靠,直接pageheap /enable xx.exe /full 設置完全頁堆模式.重新運行程序.

瞬間程序崩掉,這個激動呀.還是第一次看見程序崩掉那麼激動,查看崩潰的代碼:

原來是把一個類指針強轉爲另一個子類的指針,調用了子類的一個函數,但是該類不存在這個函數.同時這個子類函數裏面做了一次bool變量賦值,結果這個值就寫到了堆地址裏面去了.

總結

以後遇到類似問題,直接pageheap full 全開.

選自:http://hi.baidu.com/wayright/item/13dbe1b574763975254b09f2

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章