sphinx與中文分詞coreseek(window)

1.Sphinx是由俄羅斯人Andrew Aksyonoff開發的一個全文檢索引擎。意圖爲其他應用提供高速、低空間佔用、高結果 相關度的全文搜索功能,做數據庫的優化。Sphinx可以非常容易的與SQL數據庫和腳本語言集成。

2.中文分詞coreseek,官網地址:http://www.coreseek.cn/(官網不可以,只可以到別的地方下載),現在用的最多的sphinx中文全文檢索,它提供了爲Sphinx設計的中文分詞包LibMMSeg。這個項目用的詞庫格式與普通詞庫的格式不一樣, 還需要轉換一下格式才能轉換成詞庫文件. 這個項目裏提供了一個叫mmseg的可執行文件做詞庫生成,  做繁體的定製是要收費的。

windows下使用coreseek

(1)首先我們要下載coreseek的壓縮包,其中coreseek中api存放一些自帶的API類文件、bin目錄存放一些命令、etc存放配置文件、var存放創建索引之後的文件

(2)然後解壓進入coreseek/etc目錄中,打開corf_msyql.conf,編輯索引文件

(3)創建索引打開cmd,進入解壓之後的coreseek目錄,輸入命令.\bin\indexer.exe -c .\etc\csft_mysql.conf --all,沒有報錯創建索引成功

(4)開啓sphinx搜索服務,輸入命令.\bin\searchd.exe -c .\etc\csft_mysql.conf,如下顯示開啓成功

(5)接下來開始讓php操作coreseek,打開coreseek文件目錄的api目錄找到 sphinxapi.php文件複製到你的域名文件下,讓你可以訪問到,創建php文件與sphinxapi.php文件在同一級目錄下,這樣可以直接引入,用框架可以放到類文件下,php文件中輸入一下代碼

<?php
header("content-type:text/html;charset=utf8");
include'./sphinxapi.php'; //包含sphinxapi
$sphinx=new SphinxClient(); //實例化
$sphinx->SetServer('120.25.168.165',9312);//鏈接
$res=$sphinx->Query("北京","*");//查詢的字段第二參數是你配置文件裏面寫得規則這裏是*就會匹配所有規則
print_r($res);//打印數據
?>

如圖所示將以上代碼放到該目錄下操作一下如果在瀏覽器輸出一些數據你的coreseek就安裝好啦!php也可以使用了;


發佈了33 篇原創文章 · 獲贊 3 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章