標籤(空格分隔): 多維幾何
在做多維向量索引,需要用到多維空間中的一些通用距離公式,在此羅列。目前含有點-線距離。
轉自stackexchange.com,原文 通過兩個點p⃗ 1,p⃗ 2 的直線可以表示成:
則點p⃗ 到該直線的距離爲:
LSH函數性質 在一個(r,cr,p1,p2) -sensitive LSH函數上,相距較近的點有更大的碰撞概率(且有概率下界p1 ),相距較遠的點有較小的碰撞概率(有概率上界p2 )。 這樣,通過一個LSH就能過濾掉很多相距較遠
現有的外存體系是DDR內存+磁盤二級存儲結構。磁盤的優點是廉價,在存放大數據背景下的海量數據時擴充容量的代價容易承受。 但是,數據管理的其他操作就有些蛋疼了,很多基本的操作都發現無法避免一個瓶頸:內外存間的通信(Jeffrey S
在做NN算法的時候遇到了一個有意思的論文。通過向量自身的均值和方差構建的高維點間的距離下界。實現了快速的線性NN搜索。 文中發現的這一下界公式覺得很有意思,特來詳細介紹一下。 背景 高維向量間的歐式距離計算是十分昂貴的。在高維歐式