圖片識別——漢明距離

    漢明距離是以理查德·衛斯里·漢明的名字命名的。在信息論中,兩個等長字符串之間的漢明距離是兩個字符串對應位置的不同字符的個數。換句話說,它就是將一個字符串變換成另外一個字符串所需要替換的字符個數。

    例如:

    1011101 與 1001001 之間的漢明距離是 2。

    2143896 與 2233796 之間的漢明距離是 3。

    "toned" 與 "roses" 之間的漢明距離是 3。

    漢明重量是字符串相對於同樣長度的零字符串的漢明距離,也就是說,它是字符串中非零的元素個數:對於二進制字符串來說,就是 1 的個數,所以 11101 的漢明重量是 4。

    如果把a和b兩個單詞看作是向量空間中的元素,則它們之間的漢明距離等於它們漢明重量的差a-b。如果是二進制字符串a和b,漢明距離等於它們漢明重量的和a+b或者a和b漢明重量的異或a XOR b。漢明距離也等於一個n維的超立方體上兩個頂點間的曼哈頓距離,n指的是單詞的長度。

    漢明距離可以在通信中累計定長二進制字中發生翻轉的錯誤數據位,所以它也被稱爲信號距離。漢明重量分析在包括信息論、編碼理論、密碼學等領域都有應用。但是,如果要比較兩個不同長度的字符串,不僅要進行替換,而且要進行插入與刪除的運算,在這種場合下,通常使用更加複雜的編輯距離等算法。 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章