認知1. 字符串的概念
“abcd1234”
最基本的元素是字符
子串
認知2:ascii unicode utf-8到底是啥
python默認的文件編碼是ascii碼,但ascii碼是針對英文的,字符數比較少,沒有中國的字符集
unicode可以描述世界絕大部分語言,但是缺點是隻是一種通用標準,很多家都有不同的unicode實現,存儲方式不相同因此無法相互交流
utf-8是unicode的其中一種實現
需要改成utf-8碼
#coding = utf-8
一、len之需注意
len() 計算容量、大小
python3一箇中文字的長度顯示是1,python2如果顯示爲3,用命令d = “中文”.decode(‘utf-8’) 解碼成utf-8格式再計算長度
二、轉義符讓文本更好處理
三、字符串前面的小尾巴是什麼
1、將字符串轉成unicode碼,從而讓程序能夠識別 u
a = u“哈哈哈”
u代表unicode
2、不要轉義的符號 r
四、訪問字符串的子串,序列
序列是被排成一列的對象(或事件);這樣每個元素不是在其他元素之前,就是在其他元素之後。這裏,元素之間的順序非常重要。成員是有序排列的,可以通過下標偏移訪問它的成員
使用下標、切片訪問字符串的成員
五、將字符串的某部分替換成別的字符
a.replace()命令 注意字符串是不可更改對象,這個命令是創建了一個新的字符串
六、字符串拼接
1、+號,超級醜陋千萬別用
2、可選方案之字符串模板
使用佔位符%
%s 字符串
%d 整數
一般應前後類型對應,否則報錯。下面的%s %1 是默認進行了強制類型轉換,多數情況是不能轉的
引申應用:使用元組插入多個字符串
3、優秀的拼接方案
性能損耗比+號天差地別
join方法:先生成一個字符串對象,然後將要連接的字符串放在一個列表中輸入
七、讀寫文件
1、open()方法 打開
打開的方式有 只讀、寫、添加 等
open()方法返回的是一個數據流,放到緩衝區中
>>>help(open)
若不存在,自動創建
>>>help(d)
2、寫入內容
open()方法只能制定r/w/a中的一種,
用寫的方法打開後寫入之後,必須用close()方法將文件關閉纔會寫入,
3、讀內容
如果想要讀文件內容,需要用讀的方法打開
readline()方法:只顯示第一行
read(100) 讀100個字符
讀完部分數據後,遊標會移動到已經讀完的緩存數據後面,若想讀前面的數據,需要用seek()命令移動遊標。
\n換行符也算一個字符