寫個最小編輯距離吧~

def recursive_edit_distance(str1, str2, cost):
    if not str1:
        return len(str2) * cost["add"]
    if not str2:
        return len(str1) * cost["delete"]
    if str1[-1] == str2[-1]:
        return recursive_edit_distance(str1[:-1], str2[:-1], cost)
    else:
        return min(recursive_edit_distance(str1[:-1], str2, cost) + cost["delete"],
                   recursive_edit_distance(str1, str2[:-1], cost) + cost["add"],
                   recursive_edit_distance(str1[:-1], str2[:-1], cost) +
                   min(cost["replace"], cost["delete"] + cost["add"]))


def dp_edit_distance(str1, str2, cost):
    value = [[0] * (len(str2) + 1) for i in range(len(str1) + 1)]
    # 這裏不能使用value = [[0] * (len(str2) + 1)] * (len(str1) + 1)進行初始化,因爲所有行都是第一行的引用,
    # 它們是同步變化的. 最好全部用range方式初始化

    for i in range(len(str1) + 1):
        value[i][0] = i * cost["delete"]

    for j in range(len(str2) + 1):
        value[0][j] = j * cost["add"]
    for i in range(1, len(str1) + 1):
        for j in range(1, len(str2) + 1):
            if str1[i - 1] == str2[j - 1]:
                value[i][j] = value[i - 1][j - 1]
            else:
                value[i][j] = min(value[i - 1][j] + cost["delete"],
                                  value[i][j - 1] + cost["add"],
                                  value[i - 1][j - 1] + min(cost["replace"], cost["delete"] + cost["add"]))
    for i in range(len(value)):
        print(value[i])
    return value[-1][-1]


str_ = ["",
        "a",
        "abc",
        "efa",
        "bcc"]
cost = {"delete": 1, "add": 1, "replace": 1}
# 如果不同的操作對應的花費不同的話,可能出現的一個情況是,使用一次刪除和一次插入代替一次替換更加划算

for i in range(len(str_)):
    for j in range(i + 1, len(str_)):
        print("str_[{}], str_[{}]:".format(i, j),
              recursive_edit_distance(str_[i], str_[j], cost) == dp_edit_distance(str_[i], str_[j], cost))


str1 = "acef"
str2 = "abce"
print(dp_edit_distance(str1, str2, cost))

# TODO: 打印最小編輯路徑

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章