数据分析与挖掘---字符串的构造和方法

大家好,我是天空之城,今天给大家带来,数据分析与挖掘—字符串的构造和方法
1.字符串的构造
单引号:字符串中含有双引号时;
双引号:字符串中含有单引号时;
三引号 :字符串中既含有单引号又含有双引号时 ,或需要多行显示时;

2.字符串属于序列
正向单索引|
1、正向单索引指的是只获取列表中的某一个元素 ,并且是从左到右的方向索取对应位置下的元素,可以使用[index]表示。
2、需要注意的是,索引值index是从0开始的,所以索引值与实际元素的位置正好差1。
负向单索引
1.负向单索引|是指在正向单索引的基础上添加一个负号"_" , 所表达的含义是从右向左的方向获取元素,可以用[-index]表示。
2、需要注意的是,负索引index是从-1开始的。

有限切片
切片索引指的是按照固定的步长,连续取出多个元素,可以用[start:end]表示,end后面还有step。其中, start指定索弓|的起始位置; end指定索引的终止位置( 注意, end位置的元素取不到! ) ; step指步长,默认为1, 表示逐个取出子元素。

无限切片
无限切片是指在切片过程中不限定起始元素的位置或终止元素的位置,甚至起始和终止元素的位置都不限定,可以用::step]表示。第一个冒号是指从字符串的第一个元素开始获取 ;第二个冒号是指取到最后一个元素结束(包含最后一个元素值)。

3.字符串“方法”
查询“方法”
str.index(sub[, start[, end]])
str.find(sub[ start[ end]])
sub :指定查询的目标子串;
start :指定查询的起始位置;
end :指定查询的结束位置;

压缩方法
str.lstrip([chars])
str.rstrip([chars])
str.strip([chars])
chars : 指定待压缩的首尾字符,默认空格;

替换方法
str.replace(old, new)
old :指定被替换的子串;
new :指定新的子串;

格式化插入“方法’
str format (values)
values :指定格式化的值;

分割"方法"
str split(sep)
sep : 指定待分割的分割符;

price = '5元/瓶’
#取出价格,并做整型转换
print(int(price[0]))
#取出字符串中的"元
print(price[1])
#取出字符串中的"瓶”
print(price[3]) 
print(price[len(price) -1]) 

price = '5元/瓶’
#取出字符串中的"瓶"
print(price[-1])
ID = '123456198908187890
#根据身份证号码识别性别
if int(ID[-2]) %2 == 0:
	print("女")
else:
	print('男)

price2 = '24.5元/500g'
#取出价格,并转换为浮点型
print(float(price2[0:4]))
#取出字符串中的"500g"
print(price2[6:len(price2))
ID = '123456198908187890'
#取出出生日期
print(ID[6:14])


price2 = '24.5元/500g'
#取出价格,并转换为浮点型
print(float(price2[:4])) 

#取出字符串中的” 500g"
print(price2[6:])
print(price2[-4:])

price3 = '89.9元/桶'
#查询“元”所在的位置
print(price3.index(元'))
#取出价格,并转换为浮点型
print(float(price3[:price3.index(元')]))

prodName = '乒乓球拍(红双喜) '
#压缩右侧的空白字符
print(prodName .rstrip())
price3 = '单价: 18.9元/Kg'
#取出价格并转换为浮点数
print(float(price3[3:price3.index(元)].strip()))
sentence = '&&&^_ ^很喜欢,给满分!(^ - ^)'
#剔除评论中首尾的特殊字符
print(sentence.strip('&^_ ^(^ - ^)'))

sentence = '别克英朗1.3t的排量家用足够了, 1.3T对应的可是163马力! '
#将小写的t替换为大写的T --按值替换
print(sentence.replace('t','T))
tel = '1361 2347890'
#隐藏手机号中间四位
print(tel.replace(tel[3:7],'****'))

info = '尊敬的刘先生,您的话费余额为6.78元,请及时充值,以免影响通话!
#转换为格式化风格
print('尊敬的{}{},您的话费余额为{}元,请及时充值,以免影响通话! '.format('刘,先生,6.78))
#保留两位有效数字的格式化
print('ROC曲线下的AUC值为: {:.2f}'.format(0.8356444))
#生成5个有规则的网页链接
for month in [1,2,3,4,5]:
	print('http://tinqi.2345.com/t/wea history/js/20190{0}/60008_20190{0}js '.format(month))


email = 'Isx1234567 @163.com'
#将邮箱分割为邮箱名称和域名
print(email.split('@'))
info = '博佳花园| 2室2厅| 94.44平米|南北|精装'
#取出二手房中的面积值,并转换为浮点型
size = info.split('|')[2]
print(float(size.strip()[:-2]))


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章