Golang字符与字符串

原創

jiuweiC

2020-05-25 21:30

一、字符

golang的字符有两种

1.byte uint8,代表ASCII的一个字符
2.rune int32 ,是UTF-8字符，处理符合字符（汉语）的时需要用到
所以在go中，字符的本质是一个整数。

1.默认处理

	char := 'c'
	char1 := '你'
	fmt.Printf("%T,%v ,%c\n", char, char, char)
	fmt.Printf("%T,%v ,%c\n", char1, char1, char1)
	//int32,99 ,c
	//int32,20320,你

在不指定字符类型的时候是用rune处理（%T->类型，%v->相应值的默认格式,%c->字符）
2.指定处理方式

   	var byteC byte = 'j'
	fmt.Printf("%T,%v ,%c,\n", byteC, byteC, byteC)
    //uint8,106 ,j
	var runeC rune = 'J'
	fmt.Printf("%T,%v ,%c,\n", runeC, runeC, runeC)
	//uint8,106 ,j

二、字符串

在go的string底层就是一个byte数组
默认是以UTF-8进行编码的，而UTF-8是一种变长的编码字符，字符长度从一个字节到4个字节不等。
如果字符是单个的ASCII字符，则是用byte存储占一个字节，如果是复合字符，如中文是存了三个字节。

栗子🌰：

    data := "吃饭1"
	fmt.Println(len(data))//7
	fmt.Println(data[:1]) //�
	fmt.Println(data[:3])//吃

上栗中字符串的长度是7而不是3，以为这里获取的是字节的长度，一个汉字占三个字节。直接获取第一个字节则会出现乱码。
避免出现这种因为字符类型出现的问题，需要做rune转换来处理数据

   fmt.Println([]rune(data[:1]))//吃

使用range是默认当做[]rune来提取

	for _, value := range a {
		fmt.Println("type:", reflect.TypeOf(value))
		fmt.Println("type:", value)
		fmt.Println("type:", string(value))
	}
	//type: int32
    //type: 21507
    //type: 吃
    //type: int32
    //type: 39277
    //type: 饭
    //type: int32
    //type: 49
    //type: 1

总结
1、GO的字符本质是整数，单个字节，或者是多字节组合
2、byte uint8 一个字节，rune int32长度为4个字节
3、字符截取和下标索引都是根据字节为单位来产生的
4、range 遍历是使用的rune

参考：
Go 语言中的字符与字符串遍历

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Golang字符与字符串

一、字符

二、字符串

EXCEL中下拉菜单中添加新选项或者删除选项

号称能打败MLP的KAN到底行不行？数学核心原理全面解析

同事使用 insert into select 迁移数据，开开心心上线，上线后被公司开除！

Git使用经验总结5-修改提交信息

Python 爬虫：Spring Boot 反爬虫的成功案例

京东科技数字化营销能力的演进与最佳实践| 京东云技术团队

Git使用经验总结4-撤回上一次本地提交

Java中止线程的方式

压榨数据库的真实处理速度

国内SaaS遇冷？未来企业服务赛道是否还有机会？

Webpack4 一、入門

swaggo無法生成swagger.json

Golang字符與字符串

二進制原碼補碼

go is shadowed during return

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結