基於hadoop搜索引擎實踐——在線處理(六)
基於hadoop搜索引擎實踐——在線處理
這部分主要實現的是用戶從前臺輸入查詢請求,後臺對這些請求進行查詢和合並,最後前臺顯示結果信息的過程。
本系統實現使用jsp,服務器爲tomcat6.0,具體頁面實現這邊不再講述,主要講述的是後臺處理。當後臺獲取到需要查詢的信息時,把這些信息進行分詞,然後對每個關鍵詞從倒排索引文件中獲取各自MULTI_INFO,然後從所有關鍵詞中的MULTI_INFO中求並具有相同DID的SINGLE_INFO,合併的方式是,Rank值相加,Position相拼接(可暫時忽略)。經過上述合併後可生成的結果集爲最終的顯示結果。用戶觀察到的過程如下圖1-1,1-2
圖1-1 輸入查詢請求
圖1-2最後結果顯示
具體實現代碼可以查看:
參考文獻:
1.劉鵬,hadoop實戰,電子工業出版社,2011.9
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
(原創) odoo各版本對視圖中節點groups屬性的處理差別
yier
2024-06-08 14:35:45
lightdb hash index的性能和限制
zhjh256
2024-06-08 14:32:04
pathlib and difflib
root-
2024-06-08 14:31:34
利用WinSW將Nginx 作爲可正常啓動/停止的windows服務
漫漫人生路總會錯幾步
2024-06-08 14:30:54
純CSS+單個div實現抖音LOGO
劉漢貴
2024-06-08 14:30:14
告別Word,用Python打造你的專業簡歷!
十月狐狸
2024-06-08 14:24:54
一款.NET開源、免費、實用的多功能原神工具箱(改善桌面端玩家的遊戲體驗)
追逐時光
2024-06-08 14:24:33
輻射3刷藥
去megaton裏面的屍鬼.那裏買藥, 把破爛賣給他. 然後傳送到其他地圖, 再傳送回來, 他就又有錢和新藥了.繼續賣破爛, 買藥.刷幾次就夠了.
張博的博客
2024-06-08 14:22:03
重新研究go的併發模型.
張博的博客
2024-06-08 14:22:03
Python 潮流週刊#54:ChatTTS 強大的文本生成語音模型
豌豆花下貓
2024-06-08 14:21:23
kafka知識整理——部署
鄭某
2024-06-08 14:16:43
Asp .Net Core 系列:詳解鑑權(身份驗證)以及實現 Cookie、JWT、自定義三種鑑權 (含源碼解析)
IT技術派
2024-06-08 14:15:33
cdn到oss,根據用戶終端是手機和電腦等不同分別訪問兩套前端代碼
馬昌偉
2024-06-08 14:14:22
Codeforces Round 950 (Div. 3)G. Yasya and the Mysterious Tree(字典樹處理區間異或值)
SnowLove
2024-06-08 14:10:12