原创 c#正則表達式

C#正則表達式整理備忘 有一段時間,正則表達式學習很火熱很潮流,當時在CSDN一天就能看到好幾個正則表達式的帖子,那段時間藉助論壇以及Wrox Press出版的《C#字符串和正則表達式參考手冊》學習了一些基礎的知識,同時也爲我在CSDN大概

原创 正則表達式30分鐘入門教程

正則表達式30分鐘入門教程 版本:v2.31 (2009-4-11) 作者:deerchao 轉載請註明來源 目錄 跳過目錄 本文目標 如何使用本教程 正則表達式到底是什麼東西? 入門 測試正則表達式 元字符 字符轉義 重複 字符類 分枝

原创 新聞採集

//此方法獲取遠程地址的源代碼         public static string GetHtml(string url)         {                 try                 {       

原创 JavaScript解析XML的方法總結

 最近一個項目中要用到樹形列表,本來是用mztree的,但數據用了xml,本來xml就是樹形目錄,就打算用JavaScript直接解析xml文件了,網上找到一些JavaScript操作xml的方法,在此做一個總結。  我的xml文件Logi

原创 搜索引擎學習資源收集

spider是搜索引擎的必須模塊.spider數據的結果直接影響到搜索引擎的評價指標. 第一個spider程序由MIT的Matthew K Gray操刀該程序的目的是爲了統計互聯網中主機的數目 Spier定義(關於Spider的定義,有廣

原创 我的友情鏈接

51CTO博客開發

原创 c#正則表達式

C#正則表達式整理備忘 有一段時間,正則表達式學習很火熱很潮流,當時在CSDN一天就能看到好幾個正則表達式的帖子,那段時間藉助論壇以及Wrox Press出版的《C#字符串和正則表達式參考手冊》學習了一些基礎的知識,同時也爲我在CSDN大概

原创 蜘蛛/爬蟲程序的多線程控制(C#語言)

在《爬蟲/蜘蛛程序的製作(C#語言)》一文中,已經介紹了爬蟲程序實現的基本方法,可以說,已經實現了爬蟲的功能。只是它存在一個效率問題,下載速度可能很慢。這是兩方面的原因造成的: 1.       分析和下載不能同步進行。在《爬蟲/蜘蛛程序的

原创 我的友情鏈接

51CTO博客開發

原创 實現蜘蛛捕捉的PHP代碼 (WEB爬蟲)

function get_naps_bot(){$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);if (strpos($useragent, 'googlebot') !== fal

原创 正則表達式30分鐘入門教程

正則表達式30分鐘入門教程 版本:v2.31 (2009-4-11) 作者:deerchao 轉載請註明來源 目錄 跳過目錄 本文目標 如何使用本教程 正則表達式到底是什麼東西? 入門 測試正則表達式 元字符 字符轉義 重複 字符類 分枝

原创 關於 <a></a> 的通用正則表達式

正則表達式: 關於 <a></a> 的通用正則表達式  1.  普通的 <a> 元素;希望得到其中的 TEXT 以及 URL 信息;  注意: 下面寫法不正確: <a .*?href=(?<quot>["']?)(?<url>.+?\

原创 JavaScript解析XML的方法總結

 最近一個項目中要用到樹形列表,本來是用mztree的,但數據用了xml,本來xml就是樹形目錄,就打算用JavaScript直接解析xml文件了,網上找到一些JavaScript操作xml的方法,在此做一個總結。  我的xml文件Logi

原创 html固定Table表頭

<html><head><title></title><style>.Freezing_tdd { top:expression(document.getElementById('div-1').scrollTop-1);     posi

原创 新聞採集

//此方法獲取遠程地址的源代碼         public static string GetHtml(string url)         {                 try                 {