Go語言中的字符串處理

1 概述

字符串,string,一串固定長度的字符連接起來的字符集合。Go語言的字符串是使用UTF-8編碼的。UTF-8是Unicode的實現方式之一。

Go語言原生支持字符串。使用雙引號("")或反引號(``)定義。
雙引號:"", 用於單行字符串。
反引號:``,用於定義多行字符串,內部會原樣解析。
示例:

// 單行
"心有猛虎,細嗅薔薇"
// 多行
`
大風歌
大風起兮雲飛揚。
威加海內兮歸故鄉。
安得猛士兮守四方!
`

字符串支持轉義字符,列表如下:

  • \r 回車符(返回行首)
  • \n 換行符(直接跳到下一行的同列位置)
  • \t 製表符
  • \' 單引號
  • \" 雙引號
  • \\ 反斜槓
  • \uXXXX Unicode字符碼值轉義,例如 "\u5eb7" 就是 "康"

Go語言中字符串的頂層結構是由一個指針和長度構成的。使用 unsafe.Sizeof("") 會得到16長度,其中8個字節是指針,指向字符串的內存地址,8個是存儲字符串的長度。

2 常規操作

以下是針對字符串的操作總結,主要來自於Go語言的API的說明和測試。

[]索引訪問

可以使用[index]方式,訪問到字符串中的字符。可以訪問,不可以修改。

s := "Hank"
fmt.Printf("%c", s[2])
// 返回 n

unicode/utf8 包

多字節字符的處理,請參考 unicode/utf8 包的相關說明。
例如:

import "unicode/utf8"
utf8.RuneCountInString("小韓說課")
// 返回 4

len(),字符串佔用的字節數

utf-8 是變長字符集,英文標點佔用1個字節,中文佔用3個字節。

len("Hank康") 
// 返回 7

+,字符串連接"

"Hello" + " " + "Hank"

==, >, <

字符串比較,比較機制是字符的對稱比較。

"abc" > "bbcd"
// 結果爲false

strings.Compare(a, b string) int

字符串比較,比較機制是字符的對稱比較。返回值爲:

  • 0,表示a == b
  • -1,表示a < b
  • 1,表示a > b
strings.Compare("abc", "abcd")
// 返回 1

strings.Contains(s, substr string) bool

檢測字符串 substr 是否在 s 中。

strings.Contains("foobar", "foo")
// 返回 true
strings.Contains("fobar", "foo")
// 返回 false

strings.ContainsAny(s, chars string) bool

檢測字符串 chars 的中任意字符是否出現在 s 中。

fmt.Println(strings.ContainsAny("Hank", "kang")) 
// 返回 true
fmt.Println(strings.ContainsAny("Hank", "go")) 
// 返回 false

strings.ContainsRune(s string, r rune) bool

檢測 rune字符是否出現在 s 中。

strings.ContainsRune("Hank", 'a')
// 返回 true
strings.ContainsRune("Hank", 97)
// 返回 true,a的碼值97

strings.Count(s, substr string) int

統計字符串 s 中非重疊substr的數量。若統計空字符串"",會返回 s 的長度加1。

strings.Count("HanZhongKang", "n")
// 返回 3
strings.Count("Hank", "")
// 返回 5,"Hank"每個rune的前後都算

strings.EqualFold(s, t string) bool

檢測字符串 s 和 t 在忽略大小寫的情況下是否相等。

strings.EqualFold("Hank", "hank")
// 返回 true

strings.Fields(s string) []string

返回使用空格分割的字符串 s,結果爲切片。

strings.Fields("Han Zhong Kang")
// 返回 []string, ["Han", "Zhong", "Kang"]

strings.FieldsFunc(s string, f func(rune) bool) []string

使用函數確定分隔符,來分割字符串 s。結果是切片。

// ,|/ 都是分隔符
fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.FieldsFunc("go,python,c++/c,Js|JavaScript", fn)
// 返回 ["go" "python" "c++" "c" "Js" "JavaScript"]

strings.HasPrefix(s, prefix string) bool

檢測字符串 s 是否以字符串 prefix 作爲前綴。

strings.HasPrefix("Gopher", "Go")
// 返回 true

strings.HasSuffix(s, suffix string) bool

檢測字符串 s 是否以字符串 suffix 作爲後綴。

strings.HasSuffix("Gopher", "er")
// 返回 true

strings.Index(s, substr string) int

返回字符串 substr 在字符串 s 中第一次出現的索引位置,若沒有出現,返回-1。

strings.Index("Gopher", "ph")
// 返回 2

strings.IndexAny(s, chars string) int

返回字符串 chars 中的任意字符在字符串 s 中第一次出現的索引位置,若沒有出現,返回-1。

strings.IndexAny("Gopher", "lmno")
// 返回 1

strings.IndexByte(s string, c byte) int

返回byte字符 c 在字符串 s 中第一次出現的索引位置,若沒有出現,返回-1。

strings.IndexByte("Gopher", 'h')
// 返回 3

strings.IndexFunc(s string, f func(rune) bool) int

返回字符串 s 中第一次滿足函數 f 的rune字符的索引位置,若沒有出現,返回-1。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.IndexFunc("go,python,c++/c,Js|JavaScript", fn)
// 返回 2

strings.IndexRune(s string, r rune) int

返回run字符 r 在字符串 s 中第一次出現的索引位置,若沒有出現,返回-1。

strings.IndexRune("小韓說課", '說')
// 返回 6

strings.Join(a []string, sep string) string

使用分隔符 sep 連接字符串切片 a。

ss := []string{"Go", "Hank", "Python", "PHP"}
strings.Join(ss, "-")
// 返回 "Go-Hank-Python-PHP"

strings.LastIndex(s, substr string) int

返回字符串 substr 在字符串 s 中最後一次出現的索引位置,若沒有出現,返回-1。

strings.LastIndex("Hankang", "an")
// 返回 4

strings.LastIndexAny(s, chars string) int

返回字符串 chars 中的任意字符在字符串 s 中最後一次出現的索引位置,若沒有出現,返回-1。

strings.LastIndexAny("Hankang", "lmno")
// 返回 5

strings.LastIndexByte(s string, c byte) int

返回byte字符 c 在字符串 s 中最後一次出現的索引位置,若沒有出現,返回-1。

strings.LastIndexByte("Hankang", 'n')
// 返回 5

strings.LastIndexFunc(s string, f func(rune) bool) int

返回字符串 s 中字後一次滿足函數 f 的rune字符的索引位置,若沒有出現,返回-1。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.LastIndexFunc("go,Js|JavaScript", fn)
// 返回 5

strings.Map(mapping func(rune) rune, s string) string

返回字符串 s 中的每個字符經過映射函數 mapping 處理之後的字符串。

fn := func(c rune) rune {
    if strings.ContainsRune(",|/", c) {
        return '-'
    } else {
        return c
    }
}
strings.Map(fn, "go,Js|JavaScript")
// 返回 "go-Js-JavaScript"

strings.Repeat(s string, count int) string

返回將字符串 s 重複 count 的字符串。

strings.Repeat("la~", 3)
// 返回值 "la~la~la~"

strings.Replace(s, old, new string, n int) string

在字符串 s 中使用字符串 new 替換字符串 old,使用 n 限定替換次數,n設置爲負數表示沒有限制。返回替換結果。

strings.Replace("han zhong kang", "n", "N", 2)
// 返回 "haN zhoNg kang"

strings.Split(s, sep string) []string

使用分隔符 sep 分割字符串 s,返回字符串切片

strings.Split("go-Js-JavaScript", "-")
// 返回 ["go", "Js", "JavaScript"]

strings.SplitAfter(s, sep string) []string

在分隔符 sep 後分割字符串 s,返回字符串切片

strings.SplitAfter("go-Js-JavaScript", "-")
// 返回 ["go-", "Js-", "JavaScript"]

strings.SplitAfterN(s, sep string, n int) []string

在分隔符 sep 後分割字符串 s,使用 n 限定分割的元素數量,n<0全部子字符串,n>0最後一個子字符串包含餘下內容,n==0返回nil。返回子字符串切片。

strings.SplitAfterN("go-Js-JavaScript", "-", 2)
// 返回 ["go-", "Js-JavaScript"]

strings.SplitN(s, sep string, n int) []string

在分隔符 sep 分割字符串 s,使用 n 限定分割的元素數量,n<0全部子字符串,n>0最後一個子字符串包含餘下內容,n==0返回nil。返回子字符串切片。

strings.SplitN("go-Js-JavaScript", "-", 2)
// 返回 ["go", "Js-JavaScript"]

strings.Title(s string) string

返回Title化的字符串。

strings.Title("hello Hank's go")
// 返回 "Hello Hank's Go"

strings.ToLower(s string) string

轉換字符串 s 到小寫。

strings.ToLower("Hank's Go Guide")
// 返回 "hank's go guide"

strings.ToLowerSpecial(c unicode.SpecialCase, s string) string

使用特定的規則轉換字符串 s 到小寫。

strings.ToLowerSpecial(unicode.TurkishCase, "Önnek İş")
// 返回 önnek iş

strings.ToTitle(s string) string

返回全部字符都Title化的字符串。

strings.Title("hello Hank's go")
// 返回 "HELLO HANK'S GO"

strings.ToTitleSpecial(c unicode.SpecialCase, s string) string

使用特定的規則將全部字符都Title化。

strings.ToTitleSpecial(unicode.TurkishCase, "dünyanın ilk borsa yapısı Aizonai kabul edilir")
// 返回 "DÜNYANIN İLK BORSA YAPISI AİZONAİ KABUL EDİLİR"

strings.ToUpper(s string) string

將字符串 s 中所有字符轉換爲大寫。

strings.ToUpper("hello Hank's go")
// 返回 "HELLO HANK'S GO"

strings.ToUpperSpecial(c unicode.SpecialCase, s string) string

使用特定的規則將字符串 s 中所有字符轉換爲大寫。

strings.ToUpperSpecial(unicode.TurkishCase, "örnek iş")
// 返回 "ÖRNEK İŞ"

strings.Trim(s string, cutset string) string

截取字符串 s 兩端包裹的特定字符集 cutset。

strings.Trim("  user name       ", " ")
// 返回 "user name"

strings.TrimFunc(s string, f func(rune) bool) string

截取字符串 s 兩端滿足函數 f 的字符。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.TrimFunc("|/user name,/", fn)
// 返回 "user name"

strings.TrimLeft(s string, cutset string) string

截取字符串 s 左邊包裹的特定字符集 cutset。

strings.TrimLeft("  user name       ", " ")
// 返回 "user name       "

strings.TrimLeftFunc(s string, f func(rune) bool) string

截取字符串 s 左邊滿足函數 f 的字符。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.TrimLeftFunc("|/user name,/", fn)
// 返回 "user name,/"

strings.TrimPrefix(s, prefix string) string

截取字符串 s 的前綴 prefix。

strings.TrimPrefix("hank_goGuide", "hank_")
// 返回 "goGuide"

strings.TrimRight(s string, cutset string) string

截取字符串 s 右邊包裹的特定字符集 cutset。

strings.TrimRight("  user name       ", " ")
// 返回 "  user name"

strings.TrimRightFunc(s string, f func(rune) bool) string

截取字符串 s 右邊滿足函數 f 的字符。

fn := func(c rune) bool {
    return strings.ContainsRune(",|/", c)
}
strings.TrimRightFunc("|/user name,/", fn)
// 返回 "|/user name"

strings.TrimSpace(s string) string

截取字符串 s 兩端的空白字符。

strings.TrimSpace(" \t\n Hello, Gophers \n\t\r\n")
// 返回 "Hello, Gophers"

strings.TrimSuffix(s, suffix string) string

截取字符串 s 的後綴 suffix。

strings.TrimSuffix("goGuide_beta", "_beta")
// 返回 "goGuide"

完!
原文出自:小韓說課
微信關注:小韓說課
小韓說課

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章