基於如上覆雜的系統架構,尤其是4)模式,我們在測試當中也碰到相當多棘手的技術問題
1) 海量數據是否都按預期的分詞算法建立索引了呢?
2) 機器分詞的效果與手工分詞相差有多大呢?
3) 海量查詢的返回結果是否多查了
4) 海量查詢的返回結果是否漏查了
5) 海量查詢的返回結果的加亮、標註如期加了?
6) 海量查詢的返回結果中相關性分數計算是否正確?
7) 海量查詢的返回結果積分計算是否正確了呢
8) 海量查詢的返回結果積分相同時,排序的先後依據唯一麼?
9) 加入即時更新模塊後,每次查詢結果都不同,新建的索引內容是否都反饋到查詢結果裏面了呢?
10) 海量數據時CACHE是否預期CACHE該cache的內容?
11) 海量數據時CACHE是否依照一定的過時算法令cache的內容失效呢?
12) 應用程序在32位LINUX操作系統和64位的LINUX的索引、查詢結果是否依然一樣?
13) 應用程序在不同的OS上索引、查詢結果是否依然一樣?