基於hadoop搜索引擎實踐——在線處理(六)

基於hadoop搜索引擎實踐——在線處理
    這部分主要實現的是用戶從前臺輸入查詢請求,後臺對這些請求進行查詢和合並,最後前臺顯示結果信息的過程。
    本系統實現使用jsp,服務器爲tomcat6.0,具體頁面實現這邊不再講述,主要講述的是後臺處理。當後臺獲取到需要查詢的信息時,把這些信息進行分詞,然後對每個關鍵詞從倒排索引文件中獲取各自MULTI_INFO,然後從所有關鍵詞中的MULTI_INFO中求並具有相同DID的SINGLE_INFO,合併的方式是,Rank值相加,Position相拼接(可暫時忽略)。經過上述合併後可生成的結果集爲最終的顯示結果。用戶觀察到的過程如下圖1-1,1-2

圖1-1 輸入查詢請求

圖1-2最後結果顯示
    具體實現代碼可以查看:
參考文獻:
1.劉鵬,hadoop實戰,電子工業出版社,2011.9
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章