程序猿必修課之數據結構(九)串

串的定義

串(String)是由零個或多個字符組成的有限序列,又名字符串。

從定義中可以看出:、

  • 串的字符數目是“有限”的,零個字符的串叫“空串(null string)”。
  • 它是一個序列,相鄰字符之間具有前驅和後繼關係。

空格串

只包含空格的串叫“空格串”,它和空串的區別是:空格串是有內容有長度的,而且可以不止一個空格。

子串與主串

串中任意個數的連續字符組成的子序列稱爲該串的子串,相應的,包含子串的串稱爲主串。

子串在主串中的位置就是子串的第一個字符在主串中的序號。

串的比較

數字可以比較大小,串同樣可以比較大小,只不過串的比較是通過比較組成串的字符之間的編碼來進行的,而字符的編碼指的是字符在對應字符集中的序號。

比較兩個串是否相等,必須滿足兩個條件:

  1. 兩個串的長度相等
  2. 兩個串的各個對應位置的字符都相等。

編碼知識

計算機中的常用字符是使用標準的 ASCII 編碼,它由 7 位二進制數表示一個字符,總共可以表示 128 個字符。後來發現缺少一些特殊符號,於是擴展 ASCII 碼產生,它由 8 位二進制數表示,總共可以表示 256 個字符,這足夠以英語爲主的語言和特殊符號進行輸入、存儲、輸出等操作的字符需要了。但是對於以漢字爲代表的象形文字來說,顯然 256 個字符是不夠的,因此後來就有了 Unicode 編碼。

串的抽象數據類型

ADT 串(string)

Data 串中相鄰元素具有前驅和後繼關係

Operation
    
    copy(t, s): 由串 s 複製得到 t。
    clear(s): 串 s 存在,將串清空。
    isEmpty(s): 若串 s 爲空,返回 true,否則返回 false
    length(s): 返回串 s 的無數個數,即串的長度
    compare(s, t): 若 s > t,返回值爲正數;若 s == t,返回 0;若 s < t,返回負數。
    contat(t, s1, s2): 將 s1 和 s2 拼接成 t 返回。
    subString(sub, s, pos, len): 若串存在, 1 <= pos <= length(s),且 0 <= len <= length(s) - pos + 1,用 sub 返回串 s 的第 pos 個字符起長度爲 len 的子串。 
    index(s, t, pos): 串 s 和 t 存在, t 是非空串, 1 <= pos <= length(s)。若主串 s 中存在和串 t 值相同的子串,則返回它在主串 s 中第 pos 個字符之後第一次出現的位置,否則返回 -1。
    replace(s, t, v): 串 s、t 和 v 存在,t 是非空串。用 v 替換主串 s 中出現的所有與 t 相等的子串。
    insert(s, pos, t): 串 s 和 t 存在, 1 <= pos < length(s) + 1。在串 s 的第 pos 個字符之前插入串 t。
    delete(s, pos, len): 串 s 存在,1 <= pos <= length(s) - len + 1。從串 s 中刪除第 pos 個字符起長度爲 len 的子串。

endADT

串的順序存儲結構

串的順序存儲結構是用一組地址連續的存儲單元來存儲串中的字符序列的,按照預定義的大小,爲每個定義的串分配一個固定長度的存儲區(一般是用定長數組)。

但是串的順序存儲方式存在一些問題,對於字符串的操作,比如拼接、插入、替換等,都有可能使得串的升序超過數組的長度。

串的鏈式存儲結構

串的鏈式存儲結構與線性表是相似的,但由於串結構的特殊性,結構中的每個元素數據是一個字符,如果一個結點對應一個字符,就會造成很大的空間浪費,因此,一個結點可以存儲一到多個字符,最後一個結點若未被佔滿,可以用其他非串值字符補全。一個結點存多少個字符會直接影響着串處理的效率,需要根據實際情況做出選擇。

串的鏈式存儲結構除了在串的拼接等操作時方便之外,總的來說不如順序存儲靈活,性能也不如順序存儲結構好。



作者:Xiao_Mai
鏈接:https://www.jianshu.com/p/d0ad73bd638f
來源:簡書
簡書著作權歸作者所有,任何形式的轉載都請聯繫作者獲得授權並註明出處。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章