快樂的LeetCode --- 187. 重複的DNA序列

題目描述:

所有 DNA 都由一系列縮寫爲 A,C,G 和 T 的核苷酸組成,例如:“ACGAATTCCG”。在研究 DNA 時,識別 DNA 中的重複序列有時會對研究非常有幫助。

編寫一個函數來查找目標子串,目標子串的長度爲 10,且在 DNA 字符串 s 中出現次數超過一次。

示例:

輸入:s = "AAAAACCCCCAAAAACCCCCCAAAAAGGGTTT"
輸出:["AAAAACCCCC", "CCCCCAAAAA"]

解題思路: 滑動窗口

暴力解法,依次取出連續的10個元素,然後逐一判斷出現的次數即可


代碼:

寫法一:超出時間限制

from collections import Counter
class Solution(object):
    def findRepeatedDnaSequences(self, s):
        
        res = []
        ret = []
        for i in range(len(s)-9):   # 暴力解法,依次取出連續的10個元素
            res.append(s[i:i+10]) 
        temp = Counter(res)
        for j in range(len(temp)):
            if list(temp.values())[j] > 1:
                ret.append(list(temp.keys())[j])
        return ret

寫法二:優化的暴力解法(順利執行)

class Solution:
    def findRepeatedDnaSequences(self, s):
        st = set()           # 已出現的值集合
        st2 = set()          # 返回值集合
        for i in range(len(s)-9):
            if s[i: i+10] not in st2:
                if s[i: i+10] in st:        # 如果之前出現過
                    st2.add(s[i: i+10])      # 將該段加入需要返回段中
                st.add(s[i: i+10])           # 如果之前沒有出現該段,那麼將其加入已出現的值集合中
        return list(st2)    # 返回轉換成列表的返回集合

題目來源:

https://leetcode-cn.com/problems/repeated-dna-sequences

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章