字符串的編輯距離

這個應該是可以運用在機器翻譯,用戶輸入糾正

英文字和圖片來源於 :  https://www.coursera.org/nlp/

The minimum edit distance  between two strings

 

image

 

動態規劃的解法:

image

 

image   這裏如果替換一個字符的消耗是2

 

Weighted Edit Distance

那麼在計算兩個串之間的相互距離的時候, 有些情況是更容易被寫錯的,比如 google  我 可能會寫成 googel ,所以谷歌公司將幾個容易寫錯的域名都買下了,不信輸入 www.googel.com 照樣可以調整 。

同時也有某些字符之間更容易寫錯  ,這和鍵盤的佈局 或者 說兩個字符看起來比較相似 。

獨立博客: http://www.fuxiang90.me/?p=787 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章