[ASP.NET]強大的網頁處理類NSoup

原創

2019-07-19 15:16

我們如果在項目中碰到要處理HTML，如果是.NET程序員的話，強烈推薦使用NSoup，不然的話截取字符串是在是太痛苦了。NSoup是一個開源框架，是JSoup的.NET移植版本，使用方法基本一致！NSoup點擊下載

獲取網頁的html代碼

處理網頁html

[csharp]view plaincopyprint?
<span style="font-family: Arial, Helvetica, sans-serif;">NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://blog.csdn.net/dingxiaowie2013").Get();</span>  

或者是自定義html，生成html頁面

[csharp]view plaincopyprint?
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);  

但是很遺憾NSoup默認的是UTF-8，處理中文會有亂碼（對於編碼是UTF-8自然會正常，但是有些是GB2312的就可能有亂碼）

解決NSoup解析HTML亂碼的辦法

1.下載網頁源代碼再處理

[csharp]view plaincopyprint?
//下載網頁源代碼
WebClient webClient = new WebClient();  
string htmlString = Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://www.baidu.com"));  
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(htmlString);  

2.獲得網頁的流

[csharp]view plaincopyprint?
//獲得網頁流
WebRequest webRequest = WebRequest.Create("http://blog.csdn.net/dingxiaowei2013");  
NSoup.Nodes.Document doc1 = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(), "utf-8");  

效果圖

會發現跟百度的源碼是一樣的

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

C#序列化對象轉爲爲XML格式字符串

實習公司原來的左側菜單是通過js進行ajax請求一個xml文件得到一個xml對象，然後拼接html文件，現在需要從數據庫取數據生成xml，因爲保密關係，太詳細的不能放出來，簡單說下流程 1、C#後臺執行SQL，得到DataTable對象

请叫我算术嘉

2020-07-08 10:17:16

asp.net 傳值

在通過傳值打開另一個頁面時判斷是否有值傳過來在Page_Load()中寫入 if(!Page.IsPostBack) { if(Request.querystring[ "傳值 "]!=null) // Request

该用户懒的设置

2020-07-08 07:54:47

在ASP.NET 2.0中建立站點導航層次

站點導航提供程序--ASP.NET 2.0中的站點導航提供程序暴露了應用程序中的頁面的導航信息，它允許你單獨地定義站點的結構，而不用考慮頁面的實際物理佈局。默認的站點導航提供程序是基於XML的，但是你也可以通過編寫自定義的提供程序，從任何

2020-07-08 03:08:01

Request.ServerVariables[] 學習

Request.ServerVariables("Url") 返回服務器地址 Request.ServerVariables("Path_Info") 客戶端提供的路徑信息 Request.ServerVariables("Appl_

2020-07-08 11:23:15

Request.Browser 學習

SP中的Browser Capbilities組件嫩構獲取更深層次的瀏覽器信息，ASP.NET中的Browser對象可以認爲是Browser Capabilities組件的升級版本，只是ASP.NET中的Browser對象是通過調用Req

2020-07-08 11:23:15

微信第三方平臺開發-從開始到測試

一：說明 *當前文檔比較簡陋，如果有其他方法不明確可以留言。項目框架：.net freamwork 4.6.1 開發工具：vs2019 本次開發使用了Senparc.Weixin組件，地址：https://github.com/Jeff

2020-07-08 08:40:05

ASP FSO文件操作

FSO 不能操作二進制文件，要操作二進制文件，請使用：ADODB.Stream。創建文件 dim fso, f set fso = server.CreateObject("Scripting.FileSystemObject

该用户懒的设置

2020-07-08 07:54:47

ASP.NET鏈接網站的兩種方法

(1) System.Diagnostics.Process.Start("http://www.baidu.com"); (2)using System.Diagnostics //ProcessStartInfo startI

2020-07-08 06:36:40

System.ArgumentException: 指定字符串與主題所要求的形式不符。在 System.Net.Mail.Message.set_Subject(String value)

最近看系統日誌時，常常發現下面錯誤： System.ArgumentException: 指定字符串與主題所要求的形式不符。在 System.Net.Mail.Message.set_Subject(String value) 後用

2020-07-08 05:52:13

Repeater datalist

前臺:<ul> <asp:Repeater ID="Repeater1" runat="server"> <ItemTemplate> <li><%#Eval("字段")%></li> </ItemTemplate

2020-07-08 05:31:17

在ADO.NET中用參數化查詢縮短開發時間

一段時間以來，存儲過程一直是企業應用程序開發數據訪問的首選方法。存儲過程的安全性更高、封裝能力更強，並能執行復雜的邏輯，且不會打亂應用程序代碼。但是

2020-07-08 05:05:37

ASP.NET實現登錄驗證碼

製作驗證碼主要是利用了C#的GDI繪製，效果如下圖所示： html代碼： <!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="te

2020-07-08 04:12:25

Bootstrap TreeView使用教程三：製作樹形下拉框

前兩篇博客介紹了Bootstrap TreeView的使用方法，這篇博客就來介紹一下如何利用Bootstrap TreeView製作一個樹形下拉框，先來看一下效果：其實原理很簡單，先創建一個文本框，然後在文本框下方創建樹，讓其

2020-07-08 04:12:25

Bootstrap TreeView使用教程一：樹的構造和顯示

很多時候我們需要在網頁上顯示存在層級隸屬關係的數據，例如省、市、區這三者就存在隸屬關係，如果要對它們進行顯示就需要用到樹控件。百度了很久，發現同志們經常用的有zTree、jsTree等等，但考慮到工作中的前端庫是Bootstrap

2020-07-08 04:12:25

刪除GridView記錄時給確認消息

如果你想在刪除GridView中一行記錄的時候讓系統給出一個提示信息，使得用戶能在確認刪除前能選擇放棄此操作，我認爲最簡單的方法是給GridView增

2020-07-08 03:02:56

24小時熱門文章

最新文章

最新評論文章