原创 Nutch插件機制詳解(一)

  Nutch系統架構的一個亮點就是插件,借鑑這個架構我們可以設計出自己的靈活的系統架構,下面就來解析Nutch的插件系統是怎麼回事。   一、 在Nutch的插件體系架構下,有些術語需要解釋:      1、擴展點(ExtensionP

原创 在Visual Studio 2005裏,用ActiveSync來同步模擬器(Windows Mobile 5.0 For Smartphone)

一、前期環境搭建    1、Windows Mobile5.0模擬器安裝步驟以及下載地址,如下:http://news.csdn.net/news/newstopic/22/22102.shtml    2、模擬器的安裝與設置參看:Win

原创 GDI+ Vs GDI

一、GDI  GDI是位於應用程序與不同硬件之間的中間層,這種結構讓程序員從直接處理不同硬件的工作中解放出來,把硬件間的差異交給了GDI處理。GDI通過將應用程序與不同輸出設備特性相隔離,使Windows應用程序能夠毫無障礙地在Windo

原创 Doug Cutting Interview

Friday, May 28, 2004 Doug Cutting Interview   Doug Cutting is primary developer of the Lucene and Nutch open source se

原创 ERP words

A>>--------------------------------------------------------------- ABC Classification--ABC分類法對於庫存的所有物料,按照全年貨幣價值從大到小排序,然

原创 聚集索引和非聚集索引 - 實例分析

         漢語字典的正文本身就是一個聚集索引。比如,我們要查“安”字,就會很自然地翻開字典的前幾頁,因爲“安”的拼音是“an”,而按照拼音排序漢字的字典是以英文字母“a”開頭並以“z”結尾的,那麼“安”字就自然地排在字典的前部。如

原创 又是一年春節時

大雪紛飛,冰天雪地,又到了過年的時候。一年了,風風雨雨,坎坷不斷,這一年自己經歷了很多,有得有失,年終之時,值得好好總結總結了。 第一次着手做詳細的年終總結,也督促自己以後每年都能堅持這個習慣。 爲了讓自己能好好回顧度過的歲歲年年,這個方

原创 聚集索引和非聚集索引 - 概念闡述

  聚集索引   聚集索引確定表中數據的物理順序。聚集索引類似於電話簿,後者按姓氏排列數據。由於聚集索引規定數據在表中的物理存儲順序,因此一個表只能包含一個聚集索引。但該索引可以包含多個列(組合索引),就像電話簿按姓氏和名字進行組織一樣

原创 開始無限期崇拜Doug Cutting哥

最近開始研究搜索引擎和分佈式系統,準備弄下來Apache的Lucene、Nutch和Hadoop這三寶學習膜拜,在網上查了半天,意外發現原來這三寶都源自Doug哥之手,真乃是神人啊。 印證了冰哥的一句話,優秀的系統往往都是出自個人的傑作,

原创 Google 筆試題

1.單項選擇題1.  下面一段代碼的輸出是[  ]void fn( int* b){    (*b)++;}int main(){    int a=7;    fn(&a);cout<<a;return 0;}A.0     B.7  

原创 Eclipse中編譯nutch-1.0配置詳解

nutch-1.0如果不修改代碼,導入進去是有兩處錯誤的,下面是自己配置成功地方法。  配置cygwin的環境變量,這一步很重要,如果沒有配置的話,後面就會出現"Failed to get the current user's

原创 Nutch安裝配置詳細指南(Windows環境)

一、搜索引擎的原理簡介   1.一個抓網絡頁面程序     把www中的各網站的內容抓到本地   2.一個文件解析工具     把抓下來的html、doc等源文件處理爲更精確的格式文本   3.一個全文檢索、分詞、數據挖掘,解析文本

原创 Nutch插件機制詳解(二)

三、插件定義方法 如下: Xml代碼  <plugin id="urlfilter-suffix" 插件ID name="Suffix URL Filter" 插件名稱 version="1.0.0" 插件

原创 The Privates of Silicon Valley

The revolution came when we weren’t looking. It happened in a garage. In a dorm room. In countless hours of effort, ima

原创 喬布斯2005年斯坦福大學畢業典禮演講原文 – Stay hungry, stay foolish

From Stanford Report, June 14, 2005 This is the text of the Commencement address by Steve Jobs, CEO of Apple Com