线程自我终止会导致线程内部对象的析构异常?

一开始主线程A是作为一个对话框CTestDlg存在,现在,在CTestDlg的成员函数OnStartThread中始一个新线程B,OnStartThread函数中CString局部变量strA(注1)作为线程B工作函数的参数pParam,CTestDlg的成员函数OnEndThread用于设置中止线程B,见下面的示例代码1

... 线程A(主线程)
CTestDlg::OnStartThread()
{
    CString strA = "the StrA will be leak!"; // strA作为局部变量传递
    LPVOID pParam = (LPVOID)&strA;
    CWinThread* m_pThread = ::AfxBeginThread(&ThreadProc, pParam);
}

void CMsiTestDlg::OnEndThread()
{
     g_bStopThread = TRUE;
}

... 线程B
UINT ThreadProc(LPVOID pParam)
{
    CString strB = *(CString*)pParam; // 注意:堆数据的引用计数加1,这将可能产生内存泄漏!
    CString strC = "here's in thread B"; // 线程B工作函数的CString局部变量,这也可能产生内存泄漏! 

    while (!g_bStopThread)
    {
        if (g_bStopThread == TRUE)
        {
            AfxEndThread(0, TRUE);// 强行中止线程B,仅将线程中的栈数据清空,但不会对堆数据清空!
            // return 0; // 推荐使用!正常返回0, 使得strB能正常析构,将堆数据的引用计数减1,最终使得堆数据正常释放。
        }

        Sleep(200); // 模拟线程工作
    }

    return 0; //正常返回0
}

在这里,线程A与线程B的运行是非同步的,即线程A无需等待线程B的完成,启动线程B后,先进入线程B的工作函数:

提示:如果对CString引用计数比较了解,应该知道:CString对象之间的复制是通过对堆数据的引用计数机制完成的。有关堆数据的数据结构如下:
struct CStringData
{
     long nRefs;             // reference count 引用计数
     int nDataLength;        // length of data (including terminator) 数据长度
     int nAllocLength;       // length of allocation 实际在堆中分配的长度
     // TCHAR data[nAllocLength]

     TCHAR* data()           // TCHAR* to managed data 数据的首指针
      { return (TCHAR*)(this+1); }
};


在本例中,strA作为主线程A的一个函数中的局部变量,在初始化时,先在堆中分配数据,然后将堆数据的引用计数nRefs初始化为1,当strA作为参数传至线程B的工作函数中,并赋值给strB,在这里并非将strA中的堆数据在内存中重新复制一份给strB,而只是对原来堆数据的引用计数nRefs加1,最终,堆数据的引用计数nRefs为2。

回到线程A,线程A将局部变量strA析构,在析构过程中先调用InterLockDecrement(参考2)函数将数据的引用计数nRefs减1并返回减1后的引用计数值,如果nRefs小于或等于0,则调用FreeData将堆数据清空。在这里,堆数据的引用计数nRefs等于2,减1后nRefs等于1,因此,堆数据并未被释放,这就产生了潜在的内存泄漏!

再回到线程B,如果线程B正常结束(即从工作函数中正常返回0),会将strB析构,根据上文可知此时数据引用计数nRefs等于1,再次调用InterLockDecrement将引用计数nRefs减1,nRefs等于0,因此,调用FreeData使堆数据清空,这将不存在内存泄漏;如果在线程B运行过程中,在主线程A中(CTestDlg)调用OnEndThread函数,并最终调用线程B中的AfxEndThread将其自身中止,接下来发生什么呢?调试状态下跟踪至AfxEndThread内部:

void AFXAPI AfxEndThread(UINT nExitCode, BOOL bDelete)
{
#ifndef _MT
 nExitCode;
 bDelete;
#else
 // remove current CWinThread object from memory
 AFX_MODULE_THREAD_STATE* pState = AfxGetModuleThreadState();
 CWinThread* pThread = pState->m_pCurrentWinThread;
 if (pThread != NULL)
 {
  ASSERT_VALID(pThread);
  ASSERT(pThread != AfxGetApp());

  // cleanup OLE if required
  if (pThread->m_lpfnOleTermOrFreeLib != NULL)
   (*pThread->m_lpfnOleTermOrFreeLib)(TRUE, FALSE);

  if (bDelete)
   pThread->Delete();
  pState->m_pCurrentWinThread = NULL;
 }

 // allow cleanup of any thread local objects
 AfxTermThread();

 // allow C-runtime to cleanup, and exit the thread
 _endthreadex(nExitCode);
#endif //!_MT
}


AfxEndThread通过调用pThread->Delete()会使线程B的栈清空(开始线程B时就已为线程B分配了栈:参考3),然后将线程B工作函数中已为所有变量分配的栈全部清空,包括strB,但是这不会使strB得以正常析构,也就无法将堆数据的引用计数减1,并最终不会释放堆数据,引发了内存泄漏!

针对此,我另做了一个测试,并证明了strB确实未被正常析构,见下面的示例代码2:

... 线程A(主线程)
CTestDlg::OnStartThread()
{
    CString strA = "the StrA will be leak!"; // strA作为局部变量传递
    LPVOID pParam = (LPVOID)&strA;
    CWinThread* m_pThread = ::AfxBeginThread(&ThreadProc, pParam);

    WaitForSingleObject(m_pThread->m_hThread, INFINITE);
}

void CMsiTestDlg::OnEndThread()
{
     g_bStopThread = TRUE;
}

... 线程B
UINT ThreadProc(LPVOID pParam)
{
    CString strB = *(CString*)pParam; // 注意:堆数据的引用计数加1,这将可能产生内存泄漏!
    CString strC = "here's in thread B"; // 线程B工作函数的CString局部变量,这也可能产生内存泄漏! 

    while (!g_bStopThread)
    {
        if (g_bStopThread == TRUE)
        {
            AfxEndThread(0, TRUE);// 强行中止自已,仅将线程中的栈数据清空,但不会对堆数据清空!
            // return 0; // 推荐使用!正常返回0, 使得strB能正常析构,将堆数据的引用计数减1,最终使得堆数据正常释放。
        }


        g_bStopThread = TRUE; // 只进入一次, 下一次就终止自已

        Sleep(200); // 模拟线程工作
    }

    return 0; //正常返回0
}

比之示例1代码,加了两行代码(粗体显示)。
g_bStopThread = TRUE,使线程B立刻在下一次循环时结束;
WaitForSingleObject(m_pThread->m_hThread, INFINITE),等待线程B结束。
将断点设置在OnStartThread末尾}号处,按F11进入strA的析构代码:
CString::~CString()
//  free any attached data
{
     if (GetData() != _afxDataNil)
     {
          if (InterlockedDecrement(&GetData()->nRefs) <= 0)
               FreeData(GetData());
     }
}

刚进入时察看GetData()->nRefs值仍为2(见上文,线程A中的strA和线程B中的strB两次引用同一个堆数据),这意味着,在线程B自我终止后,并未正确析构strB,因而也未能对堆数据的引用计数减1。
执行完引用计数减1后,察看GetData()->nRefs值为1,未进入FreeData(GetData())行以释放堆数据,产生了内存泄漏!

至于为什么线程自我终止不能使线程内部对象正常析构,我需要进一步查阅相关资料,以后将会弥补。

其实,即使线程B不引用线程A中的堆数据仍然会发生问题,如果在线程B的工作函数中加入strC并为其初始化赋值,调用AfxEndThread强行中止线程也会导致strC不能正常析构,产生内存汇漏!

总之,在线程内部调用AfxEndThread或TerminateThread以及其它有关线程终止的函数,借以强行中止自已是不安全的,正确的做法是需要中止的时候,直接从工作线程函数中返回,以正确释放堆栈!

注:
1. strA也可以设为全局共享变量或静态变量以作示例测试。

参考:

1. CSDN文档:Win32 环境下的堆栈(一)

2. MSDN帮助

3. 关于1的一个不错的评论:
  2003.11.9 14:21 Xleep 发表评论  我同意某位仁兄的看法,堆就是堆,栈就是栈。
国内很多写书或译书的把堆(heap)写成堆栈,把栈(stack)也写成堆栈。事实上两者是不同的。
楼主写的是栈(stack).栈就是线程一开始操作系统分配给这个线程的一块内存(楼主已经讲的很详细了)。当你某个函数的局部变量很大比如接近1m,栈(stack)就会溢出。
堆正如mayax所说的那样,分缺省堆和辅助堆,在C++,C中使用delete,new,malloc、free 来操作缺省堆(缺省大小为1MB)。堆是不会溢出的。只有分配失败。比如 pvoid pv = malloc(0x100000);当malloc看到缺省堆中没有这么大的内存就会返回null,这就是分配失败。当然缺省堆不够用了的话,在 win32中你可以用heapcreate来建立一个辅助堆,用heapalloc来分配堆内存,用heapfree来释放堆内存,用 heapdestroy来销毁这个辅助堆。
建议对这个东西还弄不懂的多看看Jeffrey Richter的《windows核心编程》,这里面把win32的内存管理讲的很清楚,不过这本书的中译者还是把stack翻译成堆栈,把heap也翻译成堆栈。

另外值得一提的是全局变量不是放在堆里面而是放在pe文件的数据节(section),当操作系统装载程序的时候把pe文件的数据节映射到哪里,全局变量就在那块内存里面。这个大家可以了解一下PE结构。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章