題目
給定一個單詞列表,我們將這個列表編碼成一個索引字符串 S 與一個索引列表 A。
例如,如果這個列表是 [“time”, “me”, “bell”],我們就可以將其表示爲 S = “time#bell#” 和 indexes = [0, 2, 5]。
對於每一個索引,我們可以通過從字符串 S 中索引的位置開始讀取字符串,直到 “#” 結束,來恢復我們之前的單詞列表。
那麼成功對給定單詞列表進行編碼的最小字符串長度是多少呢?
示例:
輸入: words = [“time”, “me”, “bell”]
輸出: 10 說明: S = “time#bell#” ,
indexes = [0, 2, 5] 。
提示:
1 <= words.length <= 2000
1 <= words[i].length <= 7
每個單詞都是小寫字母 。
來源:力扣(LeetCode)
思路
首先,可以得出結論,應該先處理長單詞;
其次,給單詞數組按長度進行排序,自己重寫一個comparator就行;
然後,遍歷數組,對於每個單詞,都在編碼字符串查找一下,如果沒有的話,直接加上這個單詞,再加一個#號進行結尾,如果有的話,就可以得到出現的位置。比如在time#中查找me,得到found=2,然後要驗證該單詞後面是否緊跟着一個#號,所以我們直接訪問found+word.size()這個位置,如果不是#號,說明不能合併,我們還是要加上這個單詞和#號;
最後,返回編碼字符串的長度即可。
C++代碼
class Solution {
public:
int minimumLengthEncoding(vector<string>& words)
{
string str = "";
sort(words.begin(), words.end(), [](string& a, string& b) {return a.size() > b.size();});
for(string word : words)
{
int found = str.find(word);
if (found == string::npos || str[found + word.size()] != '#')
{
str += word + "#";
}
}
return str.size();
}
};