原创 談談lucene的數據域存儲

lucene的數據域也就是存儲document文檔的區域,只能通過ID號來定位文檔,定位後可根據指定的字段獲取所需數據。粗略的說fdt文件存儲數據,fdx文件用於通過ID號來定位文檔。(注:以下列出的內容只包含關鍵數據結構的原理部分,因爲l

原创 談談lucene中的BytesRefHash

lucene中很多的數據結構都採用了個性化的實現,而且沒有利用一些通用的開源的其它框架,主要的目的還是爲了靈活可控、保證高效率、節約內存,BytesRefHash就是其中一個基本的、重要的、核心的數據結構。 根據lucene中給出的註釋,B