原创 如何索引數以十億計的文本向量?

信息檢索中經常出現的一個問題是查找相似的文本片段。正如我們在之前的文章中所描述的(一個新的搜索引擎以及從頭構建一個搜索引擎),查詢是Cliqz的一個重要構建塊。在這種情況下,查詢可以是用戶生成的查詢(即用戶輸入到搜索引擎中的文本片段),也