using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.IO;using HtmlAgilityPack;namespace DemoCnBlogs{class Program{static void Main(string[] args){HtmlWeb web = new HtmlWeb();HtmlDocument doc = web.Load("http://www.cnblogs.com/pick/");HtmlNode node = doc.GetElementbyId("post_list");StreamWriter sw = File.CreateText("log.txt");foreach(HtmlNode child in node.ChildNodes){if (child.Attributes["class"] == null || child.Attributes["class"].Value != "post_item")continue;HtmlNode hn = HtmlNode.CreateNode(child.OuterHtml);///如果用child.SelectSingleNode("//*[@class=/"titlelnk/"]").InnerText這樣的方式查詢,是永遠以整個document爲基準來查詢,///這點就不好,理應以當前child節點的html爲基準纔對。Write(sw, String.Format("推薦:{0}", hn.SelectSingleNode("//*[@class=/"diggnum/"]").InnerText));Write(sw, String.Format("標題:{0}", hn.SelectSingleNode("//*[@class=/"titlelnk/"]").InnerText));Write(sw, String.Format("介紹:{0}", hn.SelectSingleNode("//*[@class=/"post_item_summary/"]").InnerText));Write(sw, String.Format("信息:{0}", hn.SelectSingleNode("//*[@class=/"post_item_foot/"]").InnerText));Write(sw, "----------------------------------------");}sw.Close();Console.ReadLine();}static void Write(StreamWriter writer, string str){Console.WriteLine(str);writer.WriteLine(str);}}}
結果:
摘自:http://www.cnblogs.com/ITmuse/archive/2010/05/29/1747199.html
一、背景 在日常部門OpsReview過程中,部門內多次遇到應用容器所在的宿主機磁盤繁忙導致的接口響應緩慢,TP99增高等影響服務性能的問題,其中比較有效的解決方案是開啓日誌的異步打印,可以有效避免同步日誌打印在磁盤IO高起的情況下拖慢業
本文分享自華爲雲社區《10分鐘搞懂各種內存溢出案例!!(含完整源碼,建議收藏)》,作者:冰 河。 作爲程序員,多多少少都會遇到一些內存溢出的場景,如果你還沒遇到,說明你工作的年限可能比較短,或者你根本就是個假程序員!哈哈,開個玩笑。今天,我
一 用例生成實踐效果 在組內的日常工作安排中,持續優化測試技術、提高測試效率始終是重點任務。近期,我們在探索實踐使用大模型生成測試用例,期望能夠藉助其強大的自然語言處理能力,自動化地生成更全面和高質量的測試用例。 當前,公司已經普及使用J
作者:尹航 在前文《基於阿里雲服務網格流量泳道的全鏈路流量管理(一):嚴格模式流量泳道》、《基於阿里雲服務網格流量泳道的全鏈路流量管理(二):寬鬆模式流量泳道》中,我們介紹了流量泳道的概念、使用流量泳道進行全鏈路灰度管理的方案,以及阿里雲服
本文分享自華爲雲社區《使用MetaStudio生產線四步製作數字人視頻》,作者: yd_298097624。 隨着AIGC新技術尤其是大模型技術的發展,音視頻行業、數字內容生產行業正在經歷這從生產方式和生產效率上的一個巨大變化。預測到203
引言 Reddit,作爲一個全球性的社交平臺,擁有海量的用戶生成內容,其中包括大量的圖片資源。對於數據科學家、市場研究人員或任何需要大量圖片資源的人來說,自動化地從Reddit收集圖片是一個極具價值的技能。本文將詳細介紹如何使用Pyth
DHTMLX Diagram庫允許用幾行代碼構建JavaScript流程圖,通過自動佈局和實時編輯器,它可以更容易地將複雜數據可視化到一個整潔的層次結構中。 DHTMLX Diagram v6.0版本發佈,帶來了衆多令人興奮的新功能和改進,
本文分享自華爲雲社區《【華爲雲MySQL技術專欄】MySQL內存增長問題分析案例》,作者:GaussDB 數據庫。 前言 在現網環境中,偶爾會遇到客戶實例內存OOM(Out Of Memory,即內存耗盡或溢出)的情況。MySQL數據庫
1 前言 前文 《深入跨域 - 從初識到入門》 中,大家已經對同源與跨域的產生歷史與重要性等有了一個初步的瞭解了,那麼我們應該如何解決在日常開發中遇到的跨域引起的問題呢? 2 一覽圖 我們將日常開發中的跨域解決方案大體分爲兩類:if
文|苟振東(花名:盛知) Koupleless 項目 committer 螞蟻集團技術專家 本文 5789 字 閱讀 12 分鐘 本篇文章屬於 Koupleless 進階系列文章第二篇,默認讀者對 Koupleless 的基礎概念、能力都
1. 引言 在現代軟件開發過程中,性能優化和故障排查是保證應用穩定運行的關鍵任務之一。Java作爲一種廣泛使用的編程語言,其生態中湧現出了許多優秀的監控和診斷工具,諸如:SkyWalking、Zipkin等,它們幫助開發者和運維人員
這個其實是一個特別高頻的面試題,松哥也一直很想和大家仔細來聊一聊這個話題,網上關於這塊的文章很多,但是我一直覺得要把這個問題講清楚還有點難度,今天我來試一試,看能不能和小夥伴們把這個問題梳理清楚,當然,如果小夥伴們覺得看文章不過癮,松哥也有
分享8個開箱即用的API,方便日常處理集合。 1. 快速過濾空值:Stream.ofNullable 該方法是在 Java 9 中引入的,有助於過濾集合中的所有空值,從而可能使我們避免空指針異常。 在下面的示例中,有一個包含 null 的L