线程自我终止会导致线程内部对象的析构异常？

一开始主线程A是作为一个对话框CTestDlg存在，现在，在CTestDlg的成员函数OnStartThread中开始一个新线程B，OnStartThread函数中CString局部变量strA（注1）作为线程B工作函数的参数pParam，CTestDlg的成员函数OnEndThread用于设置中止线程B，见下面的示例代码1：

... 线程A（主线程）
CTestDlg::OnStartThread()
{
    CString strA = "the StrA will be leak!"; // strA作为局部变量传递
    LPVOID pParam = (LPVOID)&strA;
    CWinThread* m_pThread ＝ ::AfxBeginThread(&ThreadProc, pParam);
}

void CMsiTestDlg::OnEndThread()
{
     g_bStopThread = TRUE;
}

... 线程B
UINT ThreadProc(LPVOID pParam)
{
CString strB = *(CString*)pParam; // 注意：堆数据的引用计数加1，这将可能产生内存泄漏！
CString strC = "here's in thread B"; // 线程B工作函数的CString局部变量，这也可能产生内存泄漏！

    while (!g_bStopThread)
    {
        if (g_bStopThread == TRUE)
        {
            AfxEndThread(0, TRUE);// 强行中止线程B，仅将线程中的栈数据清空，但不会对堆数据清空！
            // return 0; // 推荐使用！正常返回0，使得strB能正常析构，将堆数据的引用计数减1，最终使得堆数据正常释放。
        }

        Sleep(200); // 模拟线程工作
    }

    return 0; //正常返回0
}

在这里，线程A与线程B的运行是非同步的，即线程A无需等待线程B的完成，启动线程B后，先进入线程B的工作函数：

提示：如果对CString引用计数比较了解，应该知道：CString对象之间的复制是通过对堆数据的引用计数机制完成的。有关堆数据的数据结构如下：
struct CStringData
{
     long nRefs;             // reference count 引用计数
     int nDataLength;        // length of data (including terminator) 数据长度
     int nAllocLength;       // length of allocation 实际在堆中分配的长度
     // TCHAR data[nAllocLength]

     TCHAR* data()           // TCHAR* to managed data 数据的首指针
      { return (TCHAR*)(this+1); }
};

在本例中，strA作为主线程A的一个函数中的局部变量，在初始化时，先在堆中分配数据，然后将堆数据的引用计数nRefs初始化为1，当strA作为参数传至线程B的工作函数中，并赋值给strB，在这里并非将strA中的堆数据在内存中重新复制一份给strB，而只是对原来堆数据的引用计数nRefs加1，最终，堆数据的引用计数nRefs为2。

回到线程A，线程A将局部变量strA析构，在析构过程中先调用InterLockDecrement（参考2）函数将数据的引用计数nRefs减1并返回减1后的引用计数值，如果nRefs小于或等于0，则调用FreeData将堆数据清空。在这里，堆数据的引用计数nRefs等于2，减1后nRefs等于1，因此，堆数据并未被释放，这就产生了潜在的内存泄漏！

再回到线程B，如果线程B正常结束（即从工作函数中正常返回0），会将strB析构，根据上文可知此时数据引用计数nRefs等于1，再次调用InterLockDecrement将引用计数nRefs减1，nRefs等于0，因此，调用FreeData使堆数据清空，这将不存在内存泄漏；如果在线程B运行过程中，在主线程A中（CTestDlg)调用OnEndThread函数，并最终调用线程B中的AfxEndThread将其自身中止，接下来发生什么呢？调试状态下跟踪至AfxEndThread内部：

void AFXAPI AfxEndThread(UINT nExitCode, BOOL bDelete)
{
#ifndef _MT
nExitCode;
bDelete;
#else
// remove current CWinThread object from memory
AFX_MODULE_THREAD_STATE* pState = AfxGetModuleThreadState();
CWinThread* pThread = pState->m_pCurrentWinThread;
if (pThread != NULL)
{
  ASSERT_VALID(pThread);
  ASSERT(pThread != AfxGetApp());

  // cleanup OLE if required
  if (pThread->m_lpfnOleTermOrFreeLib != NULL)
   (*pThread->m_lpfnOleTermOrFreeLib)(TRUE, FALSE);

  if (bDelete)
   pThread->Delete();
  pState->m_pCurrentWinThread = NULL;
}

// allow cleanup of any thread local objects
AfxTermThread();

// allow C-runtime to cleanup, and exit the thread
_endthreadex(nExitCode);
#endif //!_MT
}

AfxEndThread通过调用pThread->Delete()会使线程B的栈清空（开始线程B时就已为线程B分配了栈：参考3），然后将线程B工作函数中已为所有变量分配的栈全部清空，包括strB，但是这不会使strB得以正常析构，也就无法将堆数据的引用计数减1，并最终不会释放堆数据，引发了内存泄漏！

针对此，我另做了一个测试，并证明了strB确实未被正常析构，见下面的示例代码2：

... 线程A（主线程）
CTestDlg::OnStartThread()
{
    CString strA = "the StrA will be leak!"; // strA作为局部变量传递
    LPVOID pParam = (LPVOID)&strA;
    CWinThread* m_pThread ＝ ::AfxBeginThread(&ThreadProc, pParam);

    WaitForSingleObject(m_pThread->m_hThread, INFINITE);
}

void CMsiTestDlg::OnEndThread()
{
     g_bStopThread = TRUE;
}

    while (!g_bStopThread)
    {
        if (g_bStopThread == TRUE)
        {
            AfxEndThread(0, TRUE);// 强行中止自已，仅将线程中的栈数据清空，但不会对堆数据清空！
            // return 0; // 推荐使用！正常返回0，使得strB能正常析构，将堆数据的引用计数减1，最终使得堆数据正常释放。
        }

        g_bStopThread = TRUE; // 只进入一次，下一次就终止自已

        Sleep(200); // 模拟线程工作
    }

    return 0; //正常返回0
}

比之示例1代码，加了两行代码（粗体显示）。
g_bStopThread = TRUE，使线程B立刻在下一次循环时结束；
WaitForSingleObject(m_pThread->m_hThread, INFINITE)，等待线程B结束。
将断点设置在OnStartThread末尾}号处，按F11进入strA的析构代码:
CString::~CString()
// free any attached data
{
     if (GetData() != _afxDataNil)
     {
          if (InterlockedDecrement(&GetData()->nRefs) <= 0)
               FreeData(GetData());
     }
}

刚进入时察看GetData()->nRefs值仍为2（见上文，线程A中的strA和线程B中的strB两次引用同一个堆数据)，这意味着，在线程B自我终止后，并未正确析构strB，因而也未能对堆数据的引用计数减1。
执行完引用计数减1后，察看GetData()->nRefs值为1，未进入FreeData(GetData())行以释放堆数据，产生了内存泄漏！

至于为什么线程自我终止不能使线程内部对象正常析构，我需要进一步查阅相关资料，以后将会弥补。

其实，即使线程B不引用线程A中的堆数据仍然会发生问题，如果在线程B的工作函数中加入strC并为其初始化赋值，调用AfxEndThread强行中止线程也会导致strC不能正常析构，产生内存汇漏！

总之，在线程内部调用AfxEndThread或TerminateThread以及其它有关线程终止的函数，借以强行中止自已是不安全的，正确的做法是需要中止的时候，直接从工作线程函数中返回，以正确释放堆栈!

注：
1. strA也可以设为全局共享变量或静态变量以作示例测试。

参考：

1. CSDN文档：Win32 环境下的堆栈(一)

2. MSDN帮助

3. 关于1的一个不错的评论:
2003.11.9 14:21 Xleep 发表评论我同意某位仁兄的看法，堆就是堆，栈就是栈。
国内很多写书或译书的把堆(heap)写成堆栈，把栈（stack）也写成堆栈。事实上两者是不同的。
楼主写的是栈(stack).栈就是线程一开始操作系统分配给这个线程的一块内存(楼主已经讲的很详细了)。当你某个函数的局部变量很大比如接近1m，栈(stack)就会溢出。
堆正如mayax所说的那样，分缺省堆和辅助堆，在C++，C中使用delete,new，malloc、free 来操作缺省堆（缺省大小为1MB）。堆是不会溢出的。只有分配失败。比如 pvoid pv = malloc(0x100000);当malloc看到缺省堆中没有这么大的内存就会返回null，这就是分配失败。当然缺省堆不够用了的话，在 win32中你可以用heapcreate来建立一个辅助堆，用heapalloc来分配堆内存，用heapfree来释放堆内存，用 heapdestroy来销毁这个辅助堆。
建议对这个东西还弄不懂的多看看Jeffrey Richter的《windows核心编程》，这里面把win32的内存管理讲的很清楚，不过这本书的中译者还是把stack翻译成堆栈，把heap也翻译成堆栈。

另外值得一提的是全局变量不是放在堆里面而是放在pe文件的数据节（section），当操作系统装载程序的时候把pe文件的数据节映射到哪里，全局变量就在那块内存里面。这个大家可以了解一下PE结构。

线程自我终止会导致线程内部对象的析构异常？

如何使用 JS 判断用户是否处于活跃状态

通过HPA+CronHPA组合应对业务复杂弹性伸缩场景

❤️‍🔥 Solon Cloud Event 新的事务特性与应用

深入淺出的《網絡socket編程指南》

在Web和C++中沉浮（隨筆二）

感謝 Graham Bradshaw 的幫助

上帝的棋子

深入 CSocket 編程之阻塞和非阻塞模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結