原创 c#正則表達式
C#正則表達式整理備忘 有一段時間,正則表達式學習很火熱很潮流,當時在CSDN一天就能看到好幾個正則表達式的帖子,那段時間藉助論壇以及Wrox Press出版的《C#字符串和正則表達式參考手冊》學習了一些基礎的知識,同時也爲我在CSDN大概
原创 正則表達式30分鐘入門教程
正則表達式30分鐘入門教程 版本:v2.31 (2009-4-11) 作者:deerchao 轉載請註明來源 目錄 跳過目錄 本文目標 如何使用本教程 正則表達式到底是什麼東西? 入門 測試正則表達式 元字符 字符轉義 重複 字符類 分枝
原创 新聞採集
//此方法獲取遠程地址的源代碼 public static string GetHtml(string url) { try {
原创 JavaScript解析XML的方法總結
最近一個項目中要用到樹形列表,本來是用mztree的,但數據用了xml,本來xml就是樹形目錄,就打算用JavaScript直接解析xml文件了,網上找到一些JavaScript操作xml的方法,在此做一個總結。 我的xml文件Logi
原创 搜索引擎學習資源收集
spider是搜索引擎的必須模塊.spider數據的結果直接影響到搜索引擎的評價指標. 第一個spider程序由MIT的Matthew K Gray操刀該程序的目的是爲了統計互聯網中主機的數目 Spier定義(關於Spider的定義,有廣
原创 我的友情鏈接
51CTO博客開發
原创 c#正則表達式
C#正則表達式整理備忘 有一段時間,正則表達式學習很火熱很潮流,當時在CSDN一天就能看到好幾個正則表達式的帖子,那段時間藉助論壇以及Wrox Press出版的《C#字符串和正則表達式參考手冊》學習了一些基礎的知識,同時也爲我在CSDN大概
原创 蜘蛛/爬蟲程序的多線程控制(C#語言)
在《爬蟲/蜘蛛程序的製作(C#語言)》一文中,已經介紹了爬蟲程序實現的基本方法,可以說,已經實現了爬蟲的功能。只是它存在一個效率問題,下載速度可能很慢。這是兩方面的原因造成的: 1. 分析和下載不能同步進行。在《爬蟲/蜘蛛程序的
原创 我的友情鏈接
51CTO博客開發
原创 實現蜘蛛捕捉的PHP代碼 (WEB爬蟲)
function get_naps_bot(){$useragent = strtolower($_SERVER['HTTP_USER_AGENT']);if (strpos($useragent, 'googlebot') !== fal
原创 正則表達式30分鐘入門教程
正則表達式30分鐘入門教程 版本:v2.31 (2009-4-11) 作者:deerchao 轉載請註明來源 目錄 跳過目錄 本文目標 如何使用本教程 正則表達式到底是什麼東西? 入門 測試正則表達式 元字符 字符轉義 重複 字符類 分枝
原创 關於 <a></a> 的通用正則表達式
正則表達式: 關於 <a></a> 的通用正則表達式 1. 普通的 <a> 元素;希望得到其中的 TEXT 以及 URL 信息; 注意: 下面寫法不正確: <a .*?href=(?<quot>["']?)(?<url>.+?\
原创 JavaScript解析XML的方法總結
最近一個項目中要用到樹形列表,本來是用mztree的,但數據用了xml,本來xml就是樹形目錄,就打算用JavaScript直接解析xml文件了,網上找到一些JavaScript操作xml的方法,在此做一個總結。 我的xml文件Logi
原创 html固定Table表頭
<html><head><title></title><style>.Freezing_tdd { top:expression(document.getElementById('div-1').scrollTop-1); posi
原创 新聞採集
//此方法獲取遠程地址的源代碼 public static string GetHtml(string url) { try {