原创 第一次坐飛機

今年十一放假我去了男朋友林劭的老家,十月一號的晚上激動的心情讓我在二號早上起的很早,因爲這是我生平第一次去坐飛機更是我第一次去林劭的家裏。很激動也很期待。。。 我們是二號7:55的航班,本打算5點起牀,可我到四點就睡不着了,躺在牀上看着熟

原创 揭祕百度用戶得分算法

seo是一個不斷變化發展互相博弈的技術。很多人對seo的理解很淺顯,就是在結構要素調整好之後,發原創文章,發有效外鏈,以數量取勝。是這樣麼?可能兩年前是這樣,現在的seo完全顛覆了之前的做法。 新的搜索引擎算法不斷地在加大用戶得分所佔的比

原创 Heritrix使用的初步總結

一、框架介紹 公司最近項目要用到全文檢索,檢索對象是一些網站的網頁內容,要使用到網絡爬蟲工具。       目前技術選型對象主要有兩個:Heritrix 和 Nutch。二者均爲Java開源框架,Heritrix 是 SourceForg

原创 分享一個源碼網站

給大家分享一個源碼網站! 網址如下: http://www.oschina.net/

原创 開源爬蟲Labin,Nutch,Neritrix介紹和對比

----------------------------------------------------------------------------------- ************** Larbin 開發語言:C++http

原创 線程池

線程池是一種多線程處理形式,處理過程中將任務添加到隊列,然後在創建線程後自動啓動這些任務。線程池線程都是後臺線程。每個線程都使用默認的堆棧大小,以默認的優先級運行,並處於多線程單元中。如果某個線程在託管代碼中空閒(如正在等待某個事件

原创 詳解Java解析XML的四種方法

XML現在已經成爲一種通用的數據交換格式,它的平臺無關性,語言無關性,系統無關性,給數據集成與交互帶來了極大的方便。對於XML本身的語法知識與技術細節,需要閱讀相關的技術文獻,這裏麪包括的內容有DOM(Document Object Mo

原创 MemCache

1簡介 Memcache是一個高性能的分佈式的內存對象緩存系統,通過在內存裏維護一個統一的巨大的hash表,它能夠用來存儲各種格式的數據,包括圖像、視頻、文件以及數據庫檢索的結果等。簡單的說就是將數據調用到內存中,然後從內存中讀取,從

原创 struts1、struts2所有版本源代碼下載地址大全,速度圍觀

來源小夥伴開發網: http://www.kaifaer.com/code-647-1-1.html jakarta-struts-1.2.2-src.tar.gz     30-Aug-2004 18:21  5.6M    j

原创 你不是書讀得少,你是經典讀得少

每次去方所,看着高高的書架,滿眼的書,一方面很慶幸,這個時代對愛書的人來說,是幸福的,一方面也很難過,這些書都像一個個陷阱,很多人陷在其中,而不自知。這就像現在的互聯網一樣,信息通暢,人人都可以發出自己的聲音,各種論調都可以看到,但有價值

原创 Tomcat version 6.0 only supports J2EE 1.2, 1.3, 1.4, and Java EE 5 Web modules

轉自:http://jingwang0523.blog.163.com/blog/static/9090710320113294551497/ 最近在用eclipse做項目,新建項目時什麼都貪新,用最新的版本,在Dynamic web

原创 OOA/OOD/OOP

                                   OOA   Object-Oriented Analysis:面向對象分析方法   是在一個系統的開發過程中進行了系統業務調查以後,按照面向對象的思想來分析問題。

原创 JMS

jms即Java消息服務(Java Message Service)應用程序接口是一個Java平臺中關於面向消息中間件(MOM)的API,用於在兩個應用程序之間,或分佈式系統中發送消息,進行異步通信。Java消息服務是一個與具體平臺

原创 初始Hive —— 深入淺出學Hive

目錄: 初始Hive Hive安裝與配置 Hive 內建操作符與函數開發 Hive JDBC hive參數 Hive 高級編程 Hive QL Hive Shell 基本操作 hive 優化 Hive體系結構 Hi

原创 什麼是哈希表

散列表(Hash table,也叫哈希表),是根據關鍵碼值(Key value)而直接進行訪問的數據結構。也就是說,它通過把關鍵碼值映射到表中一個位置來訪問記錄,以加快查找的速度。這個映射函數叫做散列函數,存放記錄的數組叫做散列表。