題目描述
編寫一個函數來查找字符串數組中的最長公共前綴。
如果不存在公共前綴,返回空字符串 ""
。
示例1:
輸入:strs = ["flower","flow","flight"]
輸出:"fl"
示例2:
輸入:strs = ["dog","racecar","car"]
輸出:""
解釋:輸入不存在公共前綴。
提示:
0 <= strs.length <= 200
0 <= strs[i].length <= 200
strs[i]
僅由小寫英文字母組成
方法一:橫向掃描
用 LCP(S1...Sn) 表示字符串 S1...Sn 的最長公共前綴。
可以得到以下結論:
LCP(S1 . . . Sn) = LCP(LCP(LCP(S1,S2),S3), . . . Sn)
基於該結論,可以得到一種查找字符串數組中最大公共前綴的簡單方法。一次遍歷字符串數組中的每個字符串,對於每個遍歷到的字符串,更新最大公共前綴
如果在尚未遍歷完所有的字符串時,最大公共前綴已經是空串,則最大公共前綴一定是空串,因此不需要繼續遍歷剩下的字符串,直接返回空串即可。
class Solution {
public String longestCommonPrefix(String[] strs) {
if (strs == null || strs.length == 0) {
return "";
}
String prefix = strs[0];
int count = strs.length;
for (int i = 1; i < count; i++) {
prefix = longestCommonPrefix(prefix, strs[i]);
if (prefix.length() == 0) {
break;
}
}
return prefix;
}
public String longestCommonPrefix(String str1, String str2) {
int length = Math.min(str1.length(), str2.length());
int index = 0;
while (index < length && str1.charAt(index) == str2.charAt(index)) {
index++;
}
return str1.substring(0, index);
}
}
複雜度分析
- 時間複雜度:O(mn),其中 m 是字符串數組中的字符串平均長度,n 是字符串的數量。最壞情況下,字符串數組中的每個字符串的每個字符都會被比較一次。
- 空間複雜度:O(1)。使用的額外空間複雜度爲常數。
方法二:縱向掃描
方法一是橫向掃描,依次遍歷每個字符串,更新最長公共前綴。另一種方法是縱向掃描。縱向掃描時,從前往後遍歷所有字符串的每一列,比較相同列上的字符是否相同,如果相同則繼續對下一列進行比較,如果不相同則當前列不再屬於公共前綴,當前列之前的部分爲最長公共前綴。
class Solution {
public String longestCommonPrefix(String[] strs) {
if (strs == null || strs.length == 0) {
return "";
}
int length = strs[0].length();
int count = strs.length;
for (int i = 0; i < length; i++) {
char c = strs[0].charAt(i);
for (int j = 1; j < count; j++) {
if (i == strs[j].length() || strs[j].charAt(i) != c) {
return strs[0].substring(0, i);
}
}
}
return strs[0];
}
}
複雜度分析
- 時間複雜度:O(mn),其中 m 是字符串數組中的字符串的平均長度,"n" 是字符串的數量。最快情況下,字符串數組中的每個字符串的每個字符都會被比較一次。
- 空間複雜度:O(1)。使用的額外空間複雜度爲常數。
方法三:分治
注意到 LCP 的計算滿足結合律,有以下結論:
LCP(S1. . . Sn) = LCP(LCP(S1 . . . Sk), LCP(Sk + 1 . . . Sn))
其中 LCP(S1 . . . Sn) 是字符串 S1 . . . Sn 的最長公共前綴, 1 < k < n。
基於上述結論,可以使用分治法得到字符串數組中的最大公共前綴。對於問題 LCP(Si . . . Sj),可以分解成兩個子問題 LCP(Si . . . Smid) 與 LCP(Smid +1 . . . Sj),其中 mid = i+j/2。對兩個子問題分別求解,然後對兩個子問題的解計算最長公共前綴,即爲原問題的解。
class Solution {
public String longestCommonPrefix(String[] strs) {
if (strs == null || strs.length == 0) {
return "";
} else {
return longestCommonPrefix(strs, 0, strs.length - 1);
}
}
public String longestCommonPrefix(String[] strs, int start, int end) {
if (start == end) {
return strs[start];
} else {
int mid = (end - start) / 2 + start;
String lcpLeft = longestCommonPrefix(strs, start, mid);
String lcpRight = longestCommonPrefix(strs, mid + 1, end);
return commonPrefix(lcpLeft, lcpRight);
}
}
public String commonPrefix(String lcpLeft, String lcpRight) {
int minLength = Math.min(lcpLeft.length(), lcpRight.length());
for (int i = 0; i < minLength; i++) {
if (lcpLeft.charAt(i) != lcpRight.charAt(i)) {
return lcpLeft.substring(0, i);
}
}
return lcpLeft.substring(0, minLength);
}
}
複雜度分析
- 時間複雜度:O(mn),其中 m 是字符串數組中的字符串的平均長度,n 是字符串的數量。時間複雜度的遞推式是 T(n) = 2 · T(n/2) + O(m),通過計算可得 T(n) = O(mn)。
- 空間複雜度:O(m log n),其中 m 是字符串數組中的字符串的平均長度,n 是字符串的數量。空間複雜度主要取決於 遞歸調用的層數,層數最大爲 log n,每層需要 m 的空間存儲返回結果。
方法四:二分查找
顯然,最長公共前綴的長度不會超過字符串數組中的最短字符串的長度。用 minLength 表示字符串數組中的最短字符串的長度,則可以在 [0,minLength] 的範圍內通過二分查找得到最長公共前綴的長度。每次取查找範圍的中間值 mid,判斷每個字符串的長度爲 mid 的前綴是否相同,如果相同則最長公共前綴的長度一定大於或等於 mid,如果不相同則最長公共前綴的長度一定小於 mid,通過上述方式將查找範圍縮小一半,直到得到最長公共前綴的長度。
class Solution {
public String longestCommonPrefix(String[] strs) {
if (strs == null || strs.length == 0) {
return "";
}
int minLength = Integer.MAX_VALUE;
for (String str : strs) {
minLength = Math.min(minLength, str.length());
}
int low = 0, high = minLength;
while (low < high) {
int mid = (high - low + 1) / 2 + low;
if (isCommonPrefix(strs, mid)) {
low = mid;
} else {
high = mid - 1;
}
}
return strs[0].substring(0, low);
}
public boolean isCommonPrefix(String[] strs, int length) {
String str0 = strs[0].substring(0, length);
int count = strs.length;
for (int i = 1; i < count; i++) {
String str = strs[i];
for (int j = 0; j < length; j++) {
if (str0.charAt(j) != str.charAt(j)) {
return false;
}
}
}
return true;
}
}
複雜度分析
- 時間複雜度:O(mn log m),其中 m 是字符串數組中的字符串的最小長度, n 是字符串的數量。二分查找的迭代執行次數是 O(log m),每次迭代最多需要比較 mn 個字符,因此總時間複雜度是 O(mn log m)。
- 空間複雜度:O(1)。使用的額外空間複雜度爲常數。