返回文件的行号,enumerate参数

如果要统计文件的行数,可以这样写:
count = len(open(filepath, 'r').readlines())
这种方法简单,但是可能比较慢,当文件比较大时甚至不能工作。

可以利用enumerate():
count = 0
for index, line in enumerate(open(filepath,'r')): 
   count += 1

enumerate() 函数用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。

可 添加 start 参数。

语法

以下是 enumerate() 方法的语法:

enumerate(sequence, [start=0])
  • sequence -- 一个序列、迭代器或其他支持迭代对象。
  • start -- 下标起始位置。

实战-----------------------------------------------------------------

我想返回敏感词所在的行号

f = open(path, 'rb')
for (num, value) in enumerate(f):
    num += 1

num就为行号,第几行

 

 

 

 

PS:精确查找敏感词

re.findall('([^a-zA-Z0-9_]|\s| )' + item['words_data'] + '([^a-zA-Z0-9_]|\s| )'

 

 

 

 

 

发布了22 篇原创文章 · 获赞 9 · 访问量 9452
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章