UTF8轉成GB2312亂碼問題解決方案

審覈完的信息要生成XML類型的文件，並且XML要採用GB2312編碼，因爲採集的新聞網站，有很多網站採用的是UTF8編碼，這樣在轉化的過程中又出現亂碼最近做了一個小項目，遇到此類問題，記錄一下，也算是一個總結。
此項目分爲兩部分，一個是新聞數據採集，一個是採集信息的審覈，最後生成XML文件。

數據採集後的數據經過用戶編輯完之後，要導出一個ACCESS文件，然後把這個文件導入到信息審覈系統。在ACCESS庫中存儲新聞信息的字段類型是ntext類型，而審覈系統庫中對應的是varchar(max)類型的字段，導入之後，發現有的空白字符會出現亂碼,表現爲問號(?)，其實經過後面的測試，這不是空白（空格）字符，而一個特殊字符，怎麼辦？經過幾番測試後發現，varchar(max)類型要改成nvarchar(max)類型，這樣導入的數據就不會再有此類問題了。

但後面的測試過程中，又會發現對導入後的採集信息更改（通過.net程序編輯功能）後，數據庫中此條信息又出現了亂碼問題，研究後發現在插入語句中這樣寫就不會出現此類問題了,如insert into 表名（news）values(N'"+更新後的值+"")，爲什麼加N？去百度一下就明白了。

到此，心中總算得到安慰，但後面的問題又讓人陷入鬱悶之中。。。。。。
審覈完的信息要生成XML類型的文件，並且XML要採用GB2312編碼，因爲採集的新聞網站，有很多網站採用的是UTF8編碼，這樣在轉化的過程中又出現亂碼（還是那個“空白”特殊字符搞的），怎麼辦？網上介紹的把UTF8轉化成GB2312就可以了，但實際發現，還是解決不了問題，這下弄的一上午爲了解決這個問題，最後還是沒有辦法，正鬱悶之時，突然想到通過VS的調試功能來看看這個特殊字符究竟是什麼玩意，最後通過把數據庫的此字段值讀取出來之後，然後轉化成字符數組，content.ToCharArray(); 一個一個的看，發現，導致亂碼的這個字符是' '注意引號中的空白，這不是一個空格，而是一個在GB2312中無法識別的特殊字符，此時突然想到，能不能把這個字符的值直接用空格替換呢？馬上行動，果然，解決了亂碼問題。真求鬱悶，這一個毛玩意浪費了一半天時間。

注意，必須要用調試出來的這個值（因爲這纔是真正的導致亂碼的那個特殊字符），調試的時候在即使窗體中粘貼。

content = content.Replace(" ", " ");

UTF8轉成GB2312亂碼問題解決方案

對Serv-U 6.0.0.2默認帳戶及密碼的一點理解

sqlserver、Mysql、Oracle三種數據庫的優缺點總結

editplus快捷鍵大全

linux命令詳解之useradd命令使用方法

如何取得一個表的所有字段名用逗號分割

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結