Apache Nutch 0.8.1 發佈
Nutch爲我們提供了這樣一個不同的選擇. 相對於那些商用的搜索引擎, Nutch作爲開放源代碼搜索引擎將會更加透明, 從而更值得大家信賴. 現在所有主要的搜索引擎都採用私有的排序算法, 而不會解釋爲什麼一個網頁會排在一個特定的位置.
Nutch 是一個基於Lucene開發的誕生不久的開放源代碼(open-source)的web搜索引擎.
儘管Web搜索是漫遊Internet的基本要求, 但是現有web搜索引擎的數目卻在下降. 並且這很有可能進一步演變成爲一個公司壟斷了幾乎所有的web搜索爲其謀取商業利益.這顯然不利於廣大Internet用戶.
Nutch爲我們提供了這樣一個不同的選擇. 相對於那些商用的搜索引擎, Nutch作爲開放源代碼搜索引擎將會更加透明, 從而更值得大家信賴. 現在所有主要的搜索引擎都採用私有的排序算法, 而不會解釋爲什麼一個網頁會排在一個特定的位置. 除此之外, 有的搜索引擎依照網站所付的費用, 而不是根據它們本身的價值進行排序. 與它們不同, Nucth沒有什麼需要隱瞞, 也沒有動機去扭曲搜索的結果. Nutch將盡自己最大的努力爲用戶提供最好的搜索結果.
Nutch 致力於讓每個人能很容易, 同時花費很少就可以配置世界一流的Web搜索引擎. 爲了完成這一宏偉的目標, Nutch必須能夠做到:
---每個月取幾十億網頁
---爲這些網頁維護一個索引
---對索引文件進行每秒上千次的搜索
---提供高質量的搜索結果
---以最小的成本運作(轉載文章請保留出處:Java家(www.javajia.com))