Create Your Own Search Engine with Python (一)

Create Your Own Search Engine with Python
用python創建你自己的搜索引擎(一)

        汗,忘了貼原地址 :http://www.zackgrossbart.com/hackito/search-engine-python/

    在特定的網站上搜索你需要的網頁,我想,這是一個非常有用的功能。然而,搜索系統不是那麼簡單,提供優質的搜索性能需要多種編程語言的知識。本文將演示一個簡單的搜索引擎,它包含一個可以在你自己的網站上運行的簡單應用。該應用也是python編程語言很好的入門教程。


    這個應用是Python, JavaScript, CSS 和 HTML的結合。它可以在任何支持CGI和 PYTHON的服務器上運行。一些配置:Python版本爲 2.5.1Apache HTTP服務器JavaScript 和 格式表單已經在IE,Firefox 和 Safari 上試過,保證可用。


這個應用的代碼是免費的,根據Apache 2.0 license發佈。也就是說歡迎你使用、拷貝和修改代碼,一切隨意。如果你發現了bugs,或有什麼意見和建議,代碼性能得到提升,我很高興你能和我聯繫。另外還需要一些其它的程序來運行這個應用。它們也是免費的,不過有些使用的是不同的license。在使用這些產品之前,你應該閱讀下這些license

Setup

安裝

Get the 
SOURCE CODE

        獲取源代碼(這部電影貌似挺讚的)


    首先,你要下載源代碼。下載地址here。下載好了,肯定就是解壓什麼的了,這個不用我解釋了吧?


    別的程序


    這個搜索引擎程序是用python 解釋器來運行的。所以,沒有python?裝個唄!安裝了python才能使用這個這個程序。

        

       本程序還可以在本地運行進行測試,只要個HTTP服務器就可以運行了。這個HTTP服務器支持CGI就可以運行程序,測試的話,就只能是Apache HTTP server 。


    運行示例程序

       只要你已經安裝好python 和 Apache HTTP server,你可以根據以下步驟來運行了。過程中,會生成一個HTML文件,裏面包含搜索的結果。你可以使用管道將這些輸出到另一個文件,再用你的瀏覽器打開它。你可能需要把可執行的python添加到你的路徑中,或是根據你的系統設置,給可執行的python指明完整的路徑。


1 解壓文件到某個目錄。

2  打開一個命令行終端,改到你解壓的目錄下。

3  你可以運行這個命令python search.py > searchoutput.html 用於在本地測試。


    這個應用程序已經配置好了,通過命令行接口運行可以很輕鬆地控制和測試。在web服務器上的配置會在後文中講解。


    核心技術

    本程序的核心技術有:

§ Python

§ JavaScript

§ Cascading Style Sheets

§ HTML

    這個應用程序是個有用的網站搜索引擎示例。也是python,CSS,javascripthtml等內容很好的入門教程。它完整地展示瞭如何使用這三種技術(三種?)來創建一個有價值、可配置的用戶接口,用於搜索你的應用程序。(原文直譯成這樣,好像不太通)

        

    爲什麼是Python(讓我想起了豆瓣上,爲什麼是python而不是ruby\php……的爭論)

       現在存在很多web腳本語言和工具。perlruby是最先映入腦海中的,但是還有很多很多可供選擇。python是一種動態類型、面向對象的語言。和java相比,python可以改變對象的類型。python不同於java,它不需要把所有的代碼都放到對象(或類)裏面。如果不使用面向對象編程的話,python看上去更像個傳統的腳本語言。


         PERL有着獨特的語法,比較難學,而ruby多半依賴於RAILS框架。它們都很流行,也可以輕鬆地用它們來實現這個應用程序。使用perl,ruby,python的爭論一直在持續,我可不打算在這裏介紹一遍。這個應用程序可以用任一種語言來實現。而python正好是我在寫這個代碼時最感興趣的語言,所以 你懂的(豆瓣也差不多吧,一切都是巧合而成,而不是真的糾結於語言的那一點特性。)


    下部分介紹工作原理和搜索算法的大致介紹。

    http://www.zackgrossbart.com/hackito/search-engine-python/

發佈了52 篇原創文章 · 獲贊 4 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章