python字符串详解

字符串

字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。通常以串的整体作为操作对象，如：在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要条件是：长度相等，并且各个对应位置上的字符都相等。
属于python基本数据类型和结构的一种。2 本身是不可变的数据类型。 3 有很多内置的方法
字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串。

var1 = 'Hello World!'
var2 = "I love Python "

字符串基本操作

1.Python访问字符串中的值

索引和切片
Python不支持单字符类型，单字符在 Python 中也是作为一个字符串使用。
Python访问子字符串，可以使用方括号来截取字符串.，当方括号中有三个参数，第三个代表步长（间隔）。

print ("var1[0]: ", , var1[0])
print ("var2[1:5]: ",, var2[1:5])
a ='123456789'
a[0:9:3]#从零到九，间隔三个取一个形成新的字符串。
# var1[0]: H
# love

下面这个代码是针对上面切片和索引归纳的几个实例

str = 'Hello World!'

print （str） # 输出完整字符串
print (str[0] )# 输出字符串中的第一个字符
print （str[2:5]） # 输出字符串中第三个至第五个之间的字符串，操作：  str[star:end:sep]
print (str[2:] )# 输出从第三个字符开始的字符串
print (str * 2) # 输出字符串两次
print( str + "TEST" )# 输出连接的字符串

2.你可以对已存在的字符串进行修改，并赋值给另一个变量

var1 = 'Hello World!'
print( "更新字符串 :- ", var1[:6] + 'Runoob!')
## 运行结果：更新字符串 :-  Hello Runoob!

3.Python字符串格式化和原始字符串

Python 支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式，但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。
在 Python 中，字符串格式化使用与 C 中 sprintf 函数一样的语法。

print ("My name is %s and weight is %d kg!" % ('Zara', 21))  # 注意双引号后还要加一个%
## 运行结果My name is Zara and weight is 21 kg!

python字符串格式化符号:

   符 号         描述
  %c     格式化字符及其ASCII码
  %s     格式化字符串
  %d     格式化整数
  %u     格式化无符号整型
  %o     格式化无符号八进制数
  %x     格式化无符号十六进制数
  %X     格式化无符号十六进制数（大写）
  %f     格式化浮点数字，可指定小数点后的精度
  %e     用科学计数法格式化浮点数
  %E     作用同%e，用科学计数法格式化浮点数
  %g     %f和%e的简写
  %G     %f 和 %E 的简写
  %p     用十六进制数格式化变量的地址

Python转义字符：

 转义字符        描述
\(在行尾时) 续行符
\\          反斜杠符号
\'          单引号
\"          双引号
\a          响铃
\b          退格(Backspace)
\e          转义
\000        空
\n          换行
\v          纵向制表符
\t          横向制表符
\r          回车
\f          换页
\oyy        八进制数，yy代表的字符，例如：\o12代表换行
\xyy        十六进制数，yy代表的字符，例如：\x0a代表换行
\other      其它的字符以普通格式输出

python 中的原始字符串
原始字符串：所有的字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。
在Python中为了使反斜杠和元字符取消字符的特殊功能，需要在字符前添加反斜杠。
解决的办法就是为正则表达式使用 python 的 raw 字符串表示；在字符串前加个 “r” 反斜杠就不会被任何特殊方式处理，所以 r”\n” 就是包含”\” 和 “n” 的两个字符，而 “\n” 则是一个字符，表示一个换行。正则表达式通常在 Python 代码中都是用这种 raw 字符串表示。
原始字符串除在字符串的第一个引号前加上字母“r”（可以大小写）以外，与普通字符串有着几乎完全相同的语法。

>>> '\n'
'\n'
>>> print( '\n')
>>> r'\n'
'\\n'
>>> print (r'\n')
\n

使用原始字符串，可以让我们减少错误。
如下例子中，打开readme.txt时出现异常，就是因为’\r’和’\t’被当成不在我们的文件名中的特殊字符。这个在读取文件路径很有用。

>>> f = open("D:\windows\temp\readme.txt",'r')
 
Traceback (most recent call last):
  File "<pyshell#0>", line 1, in <module>
    f = open("D:\windows\temp\readme.txt",'r')
IOError: [Errno 22] invalid mode ('r') or filename: 'D:\\windows\temp\readme.txt'

4.字符串连接

+直接连接字符串，当字符比较多的时候，效率是比较低的。

a = ['a','b','c','d']
content = ''
for i in a:
   content = content + i 
print (content)

说下为什么效率会低呢？
原因：在循环连接字符串的时候，他每次连接一次，就要重新开辟空间，然后把字符串连接起来，再放入新的空间，再一次循环，又要开辟新的空间，把字符串连接起来放入新的空间，如此反复，内存操作比较频繁，每次都要计算内存空间，然后开辟内存空间，再释放内存空间，效率非常低，你也许操作比较少的数据的时候看不出来，感觉影响不大，但是你碰到操作数据量比较多的时候，这个方法就要退休了。

方法1：用字符串的join方法

a = ['a','b','c','d']
content = ''
content = ''.join(a)
print (content)

用字符串的替换占位符替换
这里不详细介绍，有兴趣可以看字符串拼接的相关知识。

5.字符串替换

字符串替换可以用内置的方法和正则表达式完成。
1）用字符串本身的replace方法:
2）用正则表达式来完成替换:

a = 'hello word'
#我把a字符串里的word替换为python
#用字符串本身的replace方法
a.replace('word','python')
#用正则表达式来完成替换:
import re 用正则表达式
strinfo = re.compile('word')
b = strinfo.sub('python',a)

6.字符串比较

cmp方法比较两个对象，并根据结果返回一个整数。cmp(x,y)如果X< Y,返回值是负数如果X>Y 返回的值为正数。

7.字符串查找

python 字符串查找有4个方法，1 find,2 index方法，3 rfind方法,4 rindex方法。
1 find()方法：
2 index()方法：
python 的index方法是在字符串里查找子串第一次出现的位置，类似字符串的find方法，不过比find方法更好的是，如果查找不到子串，会抛出异常，而不是返回-1

8.字符串分割

字符串分割，可以用split,rsplit方法，通过相应的规则来切割成生成列表对象。

9.字符串翻转

通过步进反转[::-1]

a ='hello'
b = a[::-1]

10.字符串编码

通过字符串的decode和encode方法
encode([encoding,[errors]])
其中encoding可以有多种值，比如gb2312 gbk gb18030 bz2 zlib big5 bzse64等都支持。errors默认值为"strict"，意思是UnicodeError。可能的值还有’ignore’, ‘replace’, ‘xmlcharrefreplace’, ‘backslashreplace’ 和所有的通过codecs.register_error注册的值。

11.字符串长度

通过内置方法len()来计算字符串的长度，注意这个计算的是字符的长度。

a ='hello'
len(a)#5

字符串函数操作

1.字符串大小写

通过下面的upper(),lower()等方法来转换大小写
S.upper()#S中的字母大写
S.lower() #S中的字母小写
S.capitalize() #首字母大写
S.istitle() #S是否是首字母大写的
S.isupper() #S中的字母是否便是大写
S.islower() #S中的字母是否全是小写

2.字符串去空格

通过strip(),lstrip(),rstrip()方法去除字符串的空格

S.strip()去掉字符串的左右空格
S.lstrip()去掉字符串的左边空格
S.rstrip()去掉字符串的右边空格

3.字符串常用函数总结

string = '2121ddqweq'

# 把字符串的第一个字符大写
string.capitalize()  

#返回一个原字符串居中,并使用空格填充至长度 width 的新字符串
string.center(width)    

#返回 str 在 string 里面出现的次数，如果 beg 或者 end 指定则返回指定范围内 str 出现的次数  
string.count(str, beg=0, end=len(string))  

#以 encoding 指定的编码格式解码 string，如果出错默认报一个 ValueError 的 异 常 ，
#除 非 errors 指 定 的 是 'ignore' 或 者'replace'   
string.decode(encoding='UTF-8', errors='strict')

#以 encoding 指定的编码格式编码 string，如果出错默认报一个ValueError 的异常，
#除非 errors 指定的是'ignore'或者'replace'  
string.encode(encoding='UTF-8', errors='strict')

#检查字符串是否以 obj 结束，如果beg 或者 end 指定则检查指定的范围内是否以 obj 结束，如果是，
#返回 True,否则返回 False.    
string.endswith(obj, beg=0, end=len(string))

#把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8。
string.expandtabs(tabsize=8)

#检测 str 是否包含在 string 中，如果 beg 和 end 指定范围，则检查是否包含在指定范围内，
#如果是返回开始的索引值，否则返回-1
string.find(str, beg=0, end=len(string))

#跟find()方法一样，检测 str 是否包含在 string 中,只不过如果str不在 string中会报一个异常.
string.index(str, beg=0, end=len(string))

#如果 string 至少有一个字符并且所有字符都是字母或数字则返回 True,否则返回 False
string.isalnum()

#如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
string.isalpha()

#如果 string 只包含十进制数字则返回 True 否则返回 False.
string.isdecimal()

#如果 string 只包含数字则返回 True 否则返回 False.
string.isdigit()

#如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，
#则返回 True，否则返回 False
string.islower()

#如果 string 中只包含数字字符，则返回 True，否则返回 False
string.isnumeric()

#如果 string 中只包含空格，则返回 True，否则返回 False.
string.isspace()

#如果 string 是标题化的(见 title())则返回 True，否则返回 False
string.istitle()

#如果 string 中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，
#则返回 True，否则返回 False
string.isupper()

#以 string 作为分隔符，将 seq（元素序列）中所有的元素合并为一个新的字符串
string.join(seq)

#返回一个原字符串左对齐,并使用空格填充至长度 width 的新字符串
string.ljust(width)

#转换 string 中所有大写字符为小写.
string.lower()

#截掉 string 左边的空格
string.lstrip()

#maketrans() 方法用于创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，
#表示需要转换的字符，第二个参数也是字符串表示转换的目标。
string.maketrans(intab, outtab])

#返回字符串 str 中最大的字母。
max(str)

#返回字符串 str 中最小的字母。
min(str)

#有点像 find()和 split()的结合体,从 str 出现的第一个位置起,把 字 符 串 string 分 成
# 一 个 3 元 素 的 元 组 (string_pre_str,str,string_post_str),如果 string 中
#不包含str 则 string_pre_str == string.
string.partition(str)

#把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.
string.replace(str1, str2,  num=string.count(str1))

#类似于 find()函数，不过是从右边开始查找.
string.rfind(str, beg=0,end=len(string) )

#类似于 index()，不过是从右边开始.
string.rindex( str, beg=0,end=len(string))

#返回一个原字符串右对齐,并使用空格填充至长度 width 的新字符串
string.rjust(width)

#类似于 partition()函数,不过是从右边开始查找.
string.rpartition(str)

#删除 string 字符串末尾的空格.
string.rstrip()

#以 str 为分隔符切片 string为字符串列表，如果 num有指定值，则仅分隔 num 个子字符串
string.split(str="", num=string.count(str))

#按照行分隔，返回一个包含各行作为元素的列表，如果 num 指定则仅切片 num 个行.
string.splitlines(num=string.count('\n'))

#检查字符串是否是以 obj 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，
#则在指定范围内检查.
string.startswith(obj, beg=0,end=len(string))

#在 string 上执行 lstrip()和 rstrip()
string.strip([obj])

#翻转 string 中的大小写
string.swapcase()

#返回"标题化"的 string,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
string.title()

#根据 str 给出的表(包含 256 个字符)转换 string 的字符,要过滤掉的字符放到 del 参数中
string.translate(str, del="")

#转换 string 中的小写字母为大写
string.upper()

#返回长度为 width 的字符串，原字符串 string 右对齐，前面填充0
string.zfill(width)

#检查字符串是否只包含十进制字符。这种方法只存在于unicode对象。
string.isdecimal()

上面的函数参考了几篇博主的文章，大家有兴趣可以去这个几个博客上面看一下。
Python 字符串详解1
python 字符串详解2

张峰π_π

发布了41 篇原创文章 · 获赞 88 · 访问量 1万+

私信关注

python字符串详解

python字符串详解

字符串

字符串基本操作

1.Python访问字符串中的值

2.你可以对已存在的字符串进行修改，并赋值给另一个变量

3.Python字符串格式化和原始字符串

4.字符串连接

5.字符串替换

6.字符串比较

7.字符串查找

8.字符串分割

9.字符串翻转

10.字符串编码

11.字符串长度

字符串函数操作

1.字符串大小写

2.字符串去空格

3.字符串常用函数总结

高效率使用windows

智能决策新时代：可视化大屏是否能够超越传统白板？

numpy科學計算入門

Python-matplotlib入門--基礎圖表的繪製（持續更新中）

數據可視化概要

python 函數進階筆記

爬蟲系列-解析庫

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結