Golang字符與字符串

一、字符

golang的字符有兩種

  • 1.byte uint8,代表ASCII的一個字符
  • 2.rune int32 ,是UTF-8字符,處理符合字符(漢語)的時需要用到
    所以在go中,字符的本質是一個整數。

1.默認處理

	char := 'c'
	char1 := '你'
	fmt.Printf("%T,%v ,%c\n", char, char, char)
	fmt.Printf("%T,%v ,%c\n", char1, char1, char1)
	//int32,99 ,c
	//int32,20320,你

在不指定字符類型的時候是用rune處理(%T->類型,%v->相應值的默認格式,%c->字符)
2.指定處理方式

   	var byteC byte = 'j'
	fmt.Printf("%T,%v ,%c,\n", byteC, byteC, byteC)
    //uint8,106 ,j
	var runeC rune = 'J'
	fmt.Printf("%T,%v ,%c,\n", runeC, runeC, runeC)
	//uint8,106 ,j

二、字符串

在go的string底層就是一個byte數組
默認是以UTF-8進行編碼的,而UTF-8是一種變長的編碼字符,字符長度從一個字節到4個字節不等。
如果字符是單個的ASCII字符,則是用byte存儲佔一個字節,如果是複合字符,如中文是存了三個字節。

栗子🌰:

    data := "吃飯1"
	fmt.Println(len(data))//7
	fmt.Println(data[:1]) //�
	fmt.Println(data[:3])//吃

上慄中字符串的長度是7而不是3,以爲這裏獲取的是字節的長度,一個漢字佔三個字節。直接獲取第一個字節則會出現亂碼。
避免出現這種因爲字符類型出現的問題,需要做rune轉換來處理數據

   fmt.Println([]rune(data[:1]))//吃

使用range是默認當做[]rune來提取

	for _, value := range a {
		fmt.Println("type:", reflect.TypeOf(value))
		fmt.Println("type:", value)
		fmt.Println("type:", string(value))
	}
	//type: int32
    //type: 21507
    //type: 吃
    //type: int32
    //type: 39277
    //type: 飯
    //type: int32
    //type: 49
    //type: 1

總結
1、GO的字符本質是整數,單個字節,或者是多字節組合
2、byte uint8 一個字節,rune int32長度爲4個字節
3、字符截取和下標索引都是根據字節爲單位來產生的
4、range 遍歷是使用的rune

參考:
Go 語言中的字符與字符串遍歷

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章