认知1. 字符串的概念
“abcd1234”
最基本的元素是字符
子串
认知2:ascii unicode utf-8到底是啥
python默认的文件编码是ascii码,但ascii码是针对英文的,字符数比较少,没有中国的字符集
unicode可以描述世界绝大部分语言,但是缺点是只是一种通用标准,很多家都有不同的unicode实现,存储方式不相同因此无法相互交流
utf-8是unicode的其中一种实现
需要改成utf-8码
#coding = utf-8
一、len之需注意
len() 计算容量、大小
python3一个中文字的长度显示是1,python2如果显示为3,用命令d = “中文”.decode(‘utf-8’) 解码成utf-8格式再计算长度
二、转义符让文本更好处理
三、字符串前面的小尾巴是什么
1、将字符串转成unicode码,从而让程序能够识别 u
a = u“哈哈哈”
u代表unicode
2、不要转义的符号 r
四、访问字符串的子串,序列
序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。这里,元素之间的顺序非常重要。成员是有序排列的,可以通过下标偏移访问它的成员
使用下标、切片访问字符串的成员
五、将字符串的某部分替换成别的字符
a.replace()命令 注意字符串是不可更改对象,这个命令是创建了一个新的字符串
六、字符串拼接
1、+号,超级丑陋千万别用
2、可选方案之字符串模板
使用占位符%
%s 字符串
%d 整数
一般应前后类型对应,否则报错。下面的%s %1 是默认进行了强制类型转换,多数情况是不能转的
引申应用:使用元组插入多个字符串
3、优秀的拼接方案
性能损耗比+号天差地别
join方法:先生成一个字符串对象,然后将要连接的字符串放在一个列表中输入
七、读写文件
1、open()方法 打开
打开的方式有 只读、写、添加 等
open()方法返回的是一个数据流,放到缓冲区中
>>>help(open)
若不存在,自动创建
>>>help(d)
2、写入内容
open()方法只能制定r/w/a中的一种,
用写的方法打开后写入之后,必须用close()方法将文件关闭才会写入,
3、读内容
如果想要读文件内容,需要用读的方法打开
readline()方法:只显示第一行
read(100) 读100个字符
读完部分数据后,游标会移动到已经读完的缓存数据后面,若想读前面的数据,需要用seek()命令移动游标。
\n换行符也算一个字符