阿里2018秋招編程題
1、給定一個字符串S和有效單詞的字典D,請確定可以插入到S中的最小空格數,使得最終的字符串完全由D中的有效單詞組成,並輸出解。如果沒有解則應該輸出n/a
舉例:
輸入
S = “ilikealibaba”
D = [“i”, “like”, “ali”, “liba”, “baba”, “alibaba”]
Example Output:
輸出
“i like alibaba”
解釋:
字符串S可能被字典D這樣拆分
“i like ali baba”
“i like alibaba”
很顯然,第二個拆分分結果是空格數最少的解。
解題思路
定義一個兩個指針left和right,[left, right]形成一個字符串窗口或者單詞word,left和right最開始指向S的第一個字符,基本思路是:搜索S,儘可能找到一個最長的窗口word[left,right],使得word是Dict的有效字符,如果找到,left指針可以跳過word.len個位置,然後繼續向右搜索,直到S末尾。
但是,按照這個思路發現,“儘可能找一個最長的word[left, right]”有可能會使得破壞right後面的字符串的匹配,從而使得該題無解。比如:
S=“aaaabbccaa”Dict=[aa, aabbcc, aabbcca, bc],如果按照上述解題思路,那麼會發現無解,即在搜索過程中,遇到aabbcc和aabbcca這種情況,選擇了後者,然後導致最後只剩下a,無法匹配,破壞的aabbcc和aa的匹配。
ps: 在網上看到其他人用這個思路,可以通過阿里的測試樣例,那他的測試樣例就有問題了
c++代碼:
#include <iostream>
#include <set>
#include <string>
#include <vector>
using namespace std;
void mincut(const string& str, const set<string>& dict)
{
if (str.empty() || dict.empty()) {
cout << "n/a";
return;
}
int left = 0,right = 1, len = str.size();
vector<string> selections;
while(right < len){
string word = str.substr(left,right-left);
if(dict.find(word)!=dict.end()){
int e = right + 1;
while(e <= len && dict.find(str.substr(left,e-left))==dict.end())
e++;
if(e <= len) {
selections.push_back(str.substr(left,e-left));
left = right = e;
}
else{
selections.push_back(word);
left = right;
}
}
right++;
}
cout<<right<<" "<<left<<endl;
if(right-left>1){
cout<<"n/a";
}
else{
len = selections.size();
for(int i=0; i<len; i++)
cout<<selections[i]<<" ";
}
}
int main(int argc, const char * argv[])
{
string strS;
string dictStr;
int nDict;
set<string> dict;
cin >> strS;
cin >> nDict;
for (int i = 0; i < nDict; i++)
{
cin >> dictStr;
dict.insert(dictStr);
}
mincut(strS, dict);
return 0;
}