拆解Clucene系列(3)——Clucene的代碼組織結構

原創

聪明的狐狸

2020-06-28 04:55

CLucene的代碼組織還是比較清晰的，本文以CLucene1.0爲例，主要分爲以下幾個部分：

analysis

模塊主要負責詞法分析及語言處理，從而生成Term。也包括各種分析器

config

各種編譯配置選項，以及一些與OS平臺相關的內容。

debug

各種斷言異常處理宏定義，錯誤常量。還自帶一個內存泄漏跟蹤工具和內存池

document

一個document對象就是用戶提供的一篇文檔，可以包括多個Field

index

模塊主要負責索引的創建，如何讀取索引，重要的類裏IndexWriter，DocumentWriter,IndexReader,SegmentMerger,SegmentReader.
IndexWriter和DocumentWriter：負責創建索引
SegmentReader和IndexReader：負責讀取索引
Segmentmerger：負責索引的合併

queryparser

Lucene自帶的查詢引擎。負責解析用戶的輸入，可以通過掃描用戶輸入的字符串，生成各種Query對象。Clucene中支持模糊查詢，語義查詢，短語查詢，組合查詢等等,如有TermQuery,BooleanQuery,RangeQuery,WildcardQuery等。

Search

模塊主要負責對索引的搜索,打分，和排序。

Store

主要負責對索引的存儲。FSDirectory和RAMDistory是兩個重要的類，一個實現了對磁盤的跨平臺讀寫，另一個是把內存當成磁盤。

util

一些常用的工具類。主要有：
BitVector:位數組
PriorityQueue:優先級隊列，好多地方都用到此結構。
VoidList和VoidMap:分別繼承自STL的list 和map。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

C++ 基於Dijkstra最短路搜索的Ford Fulkson最大流算法

#include<iostream> #include<cstdlib> #include<cstdio> #include<ctime> #include<cstring> using namespace std; const in

2020-07-08 07:47:49

C++ 最大流(push-relable)算法

// The push-relable algorithm code due to CLRS chapter 26 #include<iostream> #include<list> using namespace std; const

2020-07-08 07:47:49

Github按照條件檢索項目

1.常用詞含義 watch：會持續收到項目的動態 fork：複製某個項目到自己的倉庫 star：可以理解爲點贊 clone：將項目下載到本地 follow：關注你感興趣的作者，會收到他們的動態 2.

BullDemonKing等待唐僧的日子

2020-07-08 07:44:33

loj#2323. 「清華集訓 2017」小 Y 和地鐵（暴搜+樹狀數組）

題面在這裏題意：看原題吧不概括了。。做法：觀察到 nn 很小。考慮直接暴力，所有區間按照左端點排序，右端點用樹狀數組維護。或者可以用位運算優化掉一個 loglog 。代碼： #include<cstdio> #i

2020-07-08 05:07:30

LightOJ-1012-Guilty Prince [DFS]

題目傳送門題意:給定一個迷宮，求與’@’相連的面積一共有多大。思路:紅黑磚問題，直接從’@’處DFS並記錄個數。 #include <bits/stdc++.h> using namespace std; char m

2020-07-08 01:01:21

hdu 5876 Sparse Graph bfs 鏈表優化

題意：求圖的補圖，然後給定s，求s到各點的最短路思路：暴力bfs，用鏈表優化，邊數題目給少了，不知道爲什麼會超時，不是顯示RE? 鏈接：http://acm.hdu.edu.cn/showproblem.php?pid=5876

2020-07-07 23:02:05

pat1004 Counting Leaves

A family hierarchy is usually presented by a pedigree tree. Your job is to count those family members who have no chil

2020-07-07 20:13:37

A - Eight HDU - 1043（A*算法、雙向bfs）

A - Eight HDU - 1043（A*算法、雙向bfs）題意給我們 8個數（1,23…）和一個字母x組成的一個序列，讓我們通過上下左右移動x操作，把這個序列變成：1 2 3 4 5 6 7 8 x 思路一

做一只大熊猫

2020-07-07 17:12:28

C - 哈密頓繞行世界問題 HDU - 2181（bfs+暴力記錄路徑）

C - 哈密頓繞行世界問題 HDU - 2181（bfs+暴力記錄路徑）思路這一題我們用bfs來搜索每一條路徑，對與正在搜素的某個路徑的下一個節點位置我們怎麼判斷它是否已經走過了？，這做的思路就是對每個節點我們都給加一個

做一只大熊猫

2020-07-07 17:12:28

B - Eight II HDU - 3567（bfs+預處理）

B - Eight II HDU - 3567 思路這一題由於是多組輸入，如果我們對每一組輸入都進行一遍 bfs 這樣肯定會T，那麼這一題的，奇妙思路就是預處理所有可能產生的終點狀態，進行bfs逆向bfs 我們假設所以的逆向

做一只大熊猫

2020-07-07 17:12:28

AOJ0118——Property Distribution(DFS)

題目鏈接題目意思就是會給你一個矩陣(最多 100 X 100)，然後裏面會有三類字符'@', '#', '*', 相鄰的(即上下左右)且相同的字符算在一個連通塊內，問總共有多少個這樣的連通塊？裸的DFS，對每種字符用一次

2020-07-07 12:36:39

AOJ0121——Seven Puzzle(BFS)

題目鏈接話說鄙人做這道題都有種把翔都做出來的感覺，主要是死在對string(一個自己不是很懂的東西)的不瞭解。然後一直在調bug，題意就是給你一個8宮格，然後0表示空缺，可以將相鄰位的數字與空缺交換，以表示將該數字塊移到空缺

2020-07-07 12:36:39

藍橋杯歷屆試題郵局（DFS）

問題描述　　C村住着n戶村民，由於交通閉塞，C村的村民只能通過信件與外界交流。爲了方便村民們發信，C村打算在C村建設k個郵局，這樣每戶村民可以去離自己家最近的郵局發信。　　現在給出了m個備選的郵局，請從中選出k個來，使得村民到自己家最

爱你就像爱生命

2020-07-07 06:16:58

Codeforces Round #370 (Div. 2) C. Memory and De-Evolution【dfs+想法】

剛開始想從(x,x,x)進過一些方法得到(y,y,y)，但是想了好多方法都不行。後來發現反過來想比較簡單從(y,y,y)開始，按照三角形的要求得到下一個爲(2*y-1,y,y)，然後一直這樣做下去。最後當三角形邊最小的長度大於x時

永远热血沸腾

2020-07-07 03:50:32

[DFS]poj1321

題意：就是在給定的n*n的棋盤上放k個棋子，要求不能同行同列。並且棋盤上只有#的位置才能放棋子，問總共有多少種情況？分析：首先看到不同行不同列，那麼想到的是神馬呢？八數碼問題。那麼就回想已有的東西里哪些可以用到。那麼這個

2020-07-07 02:13:29

24小時熱門文章

Spring Cloud 部署時如何使用 Kubernetes 作爲註冊中心和配置中心

最新文章

最新評論文章