Create Your Own Search Engine with Python (一)

Create Your Own Search Engine with Python
用python创建你自己的搜索引擎(一)

        汗,忘了贴原地址 :http://www.zackgrossbart.com/hackito/search-engine-python/

    在特定的网站上搜索你需要的网页,我想,这是一个非常有用的功能。然而,搜索系统不是那么简单,提供优质的搜索性能需要多种编程语言的知识。本文将演示一个简单的搜索引擎,它包含一个可以在你自己的网站上运行的简单应用。该应用也是python编程语言很好的入门教程。


    这个应用是Python, JavaScript, CSS 和 HTML的结合。它可以在任何支持CGI和 PYTHON的服务器上运行。一些配置:Python版本为 2.5.1Apache HTTP服务器JavaScript 和 格式表单已经在IE,Firefox 和 Safari 上试过,保证可用。


这个应用的代码是免费的,根据Apache 2.0 license发布。也就是说欢迎你使用、拷贝和修改代码,一切随意。如果你发现了bugs,或有什么意见和建议,代码性能得到提升,我很高兴你能和我联系。另外还需要一些其它的程序来运行这个应用。它们也是免费的,不过有些使用的是不同的license。在使用这些产品之前,你应该阅读下这些license

Setup

安装

Get the 
SOURCE CODE

        获取源代码(这部电影貌似挺赞的)


    首先,你要下载源代码。下载地址here。下载好了,肯定就是解压什么的了,这个不用我解释了吧?


    别的程序


    这个搜索引擎程序是用python 解释器来运行的。所以,没有python?装个呗!安装了python才能使用这个这个程序。

        

       本程序还可以在本地运行进行测试,只要个HTTP服务器就可以运行了。这个HTTP服务器支持CGI就可以运行程序,测试的话,就只能是Apache HTTP server 。


    运行示例程序

       只要你已经安装好python 和 Apache HTTP server,你可以根据以下步骤来运行了。过程中,会生成一个HTML文件,里面包含搜索的结果。你可以使用管道将这些输出到另一个文件,再用你的浏览器打开它。你可能需要把可执行的python添加到你的路径中,或是根据你的系统设置,给可执行的python指明完整的路径。


1 解压文件到某个目录。

2  打开一个命令行终端,改到你解压的目录下。

3  你可以运行这个命令python search.py > searchoutput.html 用于在本地测试。


    这个应用程序已经配置好了,通过命令行接口运行可以很轻松地控制和测试。在web服务器上的配置会在后文中讲解。


    核心技术

    本程序的核心技术有:

§ Python

§ JavaScript

§ Cascading Style Sheets

§ HTML

    这个应用程序是个有用的网站搜索引擎示例。也是python,CSS,javascripthtml等内容很好的入门教程。它完整地展示了如何使用这三种技术(三种?)来创建一个有价值、可配置的用户接口,用于搜索你的应用程序。(原文直译成这样,好像不太通)

        

    为什么是Python(让我想起了豆瓣上,为什么是python而不是ruby\php……的争论)

       现在存在很多web脚本语言和工具。perlruby是最先映入脑海中的,但是还有很多很多可供选择。python是一种动态类型、面向对象的语言。和java相比,python可以改变对象的类型。python不同于java,它不需要把所有的代码都放到对象(或类)里面。如果不使用面向对象编程的话,python看上去更像个传统的脚本语言。


         PERL有着独特的语法,比较难学,而ruby多半依赖于RAILS框架。它们都很流行,也可以轻松地用它们来实现这个应用程序。使用perl,ruby,python的争论一直在持续,我可不打算在这里介绍一遍。这个应用程序可以用任一种语言来实现。而python正好是我在写这个代码时最感兴趣的语言,所以 你懂的(豆瓣也差不多吧,一切都是巧合而成,而不是真的纠结于语言的那一点特性。)


    下部分介绍工作原理和搜索算法的大致介绍。

    http://www.zackgrossbart.com/hackito/search-engine-python/

发布了52 篇原创文章 · 获赞 4 · 访问量 9万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章