YaCy—基於P2P的分佈式開源搜索引擎

  YaCy是一個基於P2P的分佈式網頁搜索引擎系統,任何人都可以用YaCy爲自己建立個人的搜索門戶,以實現信息的自由共享。經過了長達5年的開發,YaCy團隊於2011年11月發佈了這個開源的、分佈式搜索引擎的1.0版本。該版本基於GPL許可,被設計用來替代目前的一些由一家公司集中託管的傳統搜索服務,如Google等。 
  YaCy—基於P2P的分佈式開源搜索引擎 - 張德德 - ——挨踢民工 Playkid—— 
  其核心是分佈在數百臺計算機上的被稱爲YaCy-peer的計算機程序,基於p2p網絡構成了YaCy網絡,整個網絡是一個分散的架構,所有的peer處於對等的地位,沒有統一的中心服務器,每個peer獨立地進行互聯網的爬行抓取,分析及建立索引庫,並通過p2p網絡進行共享;而且每個peer又都是一個獨立的代理服務器,能夠對本機使用的網頁進行索引,也通過本機運行的web服務器進行查詢和返回結果,電腦會整理出自己的獨立搜索索引和排名。
  YaCy—基於P2P的分佈式開源搜索引擎 - 張德德 - ——挨踢民工 Playkid——
  YaCy同時也是一個Http緩存代理服務器,它可以搜索你自己的或全局的索引,也可以抓取自己的網頁或啓動分佈式Crawling等。YaCy可以用於局域網中的本地搜索。
  YaCy搜索引擎主要包括五個部分,除普通搜索引擎所具有的爬行器、索引器、反排序的索引庫外,它還包括了一個非常豐富的搜索與管理界面以及用於數據共享的P2P網絡。
  YaCy—基於P2P的分佈式開源搜索引擎 - 張德德 - ——挨踢民工 Playkid——
  YaCy採用多種機制保護用戶的隱私,YaCy網絡基於點對點連接,而不是通過中央服務器進行搜索查詢,保證內容不被審查,而且所有的搜索請求都被加密,搜索結果不會被中央服務器記錄和分析。
  YaCy提供Windows、Linux、Mac OS版本的程序供下載,Windows下是一個exe的文件,直接安裝,即可以進行搜索。YaCy第一個版本已經發布,目前有14億份文檔已編入索引,已完成了13萬次搜索。專業的科學搜索引擎Sciencenet也是基於YaCy技術。
  本文地址:http://playkid.blog.163.com/blog/static/562872602014815111228800/
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章