算法----單詞的壓縮編碼

來道算法題,壓壓驚。

給定一個單詞列表,我們將這個列表編碼成一個索引字符串 S 與一個索引列表 A。

例如,如果這個列表是 ["time", "me", "bell"],我們就可以將其表示爲 S = "time#bell#" 和 indexes = [0, 2, 5]。

對於每一個索引,我們可以通過從字符串 S 中索引的位置開始讀取字符串,直到 "#" 結束,來恢復我們之前的單詞列表。

那麼成功對給定單詞列表進行編碼的最小字符串長度是多少呢?

示例:輸入: words = ["time", "me", "bell"]

輸出: 10

說明: S = "time#bell#" , indexes = [0, 2, 5] 。

提示:1 <= words.length <= 2000   1 <= words[i].length <= 7   每個單詞都是小寫字母 。
         對於每一個索引通過從字符串 S 中索引的位置開始讀取字符串,直到 "#" 結束,來恢復之前的單詞列表,其實就是求解所給出的單詞列表中去除某些單詞是其他單詞後綴的情況,即保留所有不是其他單詞後綴的單詞。

解法一   將單詞列表按照單詞長度排序  從最長單詞開始遍歷  對於後續的每一個單詞j  查看比它長度長的單詞集合中是否有其可以作爲後綴的,如果有,則說明單詞j可以從集合中去除。最終將剩餘單詞集合長度相加即可。

// words = ["time", "me", "bell"]    S = "time#bell#" , indexes = [0, 2, 5] 。  10
    public int minimumLengthEncoding(String[] words) {
        if(null==words || words.length==0) return 0;
        if(words.length == 1) return words[0].length()+1;
        Arrays.sort(words, Comparator.comparingInt(String::length));
        int num = words[words.length-1].length()+1;
        //System.out.println(Arrays.toString(words));
        //StringBuilder sb = new StringBuilder();
        //sb.append(words[words.length-1]);
        //sb.append("#");
        for(int i=words.length-2; i>=0; i--){
            boolean flag = false;
            for(int j=words.length-1; j>i; j--){
                //System.out.println(words[j]+" "+words[i] + " " + words[j].contains(words[i]));
                if(words[j].endsWith(words[i])){
                    flag = true;
                    break;
                }
            }
            if(!flag){
                //sb.append(words[i]);
                //sb.append("#");
                num += words[i].length()+1;
            }
        }
        //System.out.println(sb.toString());
        //return sb.length();
        return num;
    }

解法二   將單詞列表放入集合set中,遍歷單詞列表,考慮每一個單詞的可能後綴,將其從集合set中去除

                                        fig1

代碼如下:

    public int minimumLengthEncoding2(String[] words) {
        Set<String> set = new HashSet<>(Arrays.asList(words));
        // 將所有可能的後綴從set中剔除
        for(String word: words){
            for(int k=1; k<word.length(); k++){
                set.remove(word.substring(k));
            }
        }
        int num = 0;
        for(String s: set){
            num += s.length()+1;
        }
        return num;
    }

解法三  單詞樹

從每一個單詞逆序放入單詞樹中,此時具有後綴包含的單詞則隱藏長單詞的單詞路徑中,統計單詞樹的長度即可

                                 fig2

代碼如下:

   public int minimumLengthEncoding3(String[] words) {
        TrieNode trie = new TrieNode();
        Map<TrieNode, Integer> nodes = new HashMap<>();
        for(int i=0; i<words.length; i++){
            String word = words[i];
            TrieNode cur = trie;
            for(int j=word.length()-1; j>=0; j--){
                cur = cur.get(word.charAt(j));
            }
            nodes.put(cur, i);
        }
        int ans = 0;
        for(TrieNode node: nodes.keySet()){
            if(node.count == 0){
                ans += words[nodes.get(node)].length() + 1;
            }
        }
        return ans;
    }

    class TrieNode {
        TrieNode[] children;
        int count;
        TrieNode() {
            children = new TrieNode[26];
            count = 0;
        }
        public TrieNode get(char c){
            int index = c - 'a';
            if(null == children[index]){
                children[index] = new TrieNode();
                count++;
            }
            return children[index];
        }
    }

參考地址

https://leetcode-cn.com/problems/short-encoding-of-words/solution/dan-ci-de-ya-suo-bian-ma-by-leetcode-solution/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章