Python文件(I/O)操作详解

本文介绍了Python I/O操作,包括文件读取,文件写入等操作。也是Python系列教程的最后一篇(共8篇)。


系列文章

【Python 基础】一文补齐Python基础知识
【趣学Python:B站四大恶人】一文掌握列表、元组、字典、集合
【Python进阶】一文掌握Python函数用法
【Python进阶】Python面向对象之类与对象详解
【Python进阶】Python面向对象之装饰器与封装
【Python进阶】Python面向对象之继承和多态详解
【Python进阶】Python异常处理和模块
【Python进阶】Python文件(I/O)操作详解



👉Python内置函数官方文档


1. 文件

1.1 打开文件

使用 open() 函数来打开一个文件

open(file, mode='r', buffering=-1, encoding_=None, 
	 errors=None, newline=None, closefd=True, opener=None)

主要参数说明:

  • file:要打开的文件的名字(路径);
  • mode :是一个可选参数,用于指定打开文件的模式。默认状态为 'r',表示只读。
  • 返回值:返回一个对象,这个对象就代表了当前打开的文件;

注意:

  1. 如果目标文件和当前文件在同一级目录下,则直接使用文件名即可;
file_name = 'demo.txt'
file_obj = open(file_name) 
  1. 在windows系统使用路径时,可以使用 / 来代替 \,或者可以使用 \\ 来代替 \。因为 \ 在Python中是转义字符;
  2. 也可以使用原始字符串;
file_name = 'hello\\demo.txt'
file_name = r'hello\demo.txt'
file_obj = open(file_name) 
  1. 表示路径,可以使用 .. 来返回一级目录;
file_name = '../hello/demo.txt'
file_obj = open(file_name) 
  1. 如果目标文件距离当前文件比较远,此时可以使用绝对路径。绝对路径应该从磁盘的根目录开始书写;
file_name = r'C:\demo.txt'
file_obj = open(file_name) 
print(file_obj)

1.2 关闭文件

# 打开文件
file_name = 'demo.txt'
file_obj = open(file_name)
  1. 读取文件
    当我们获取了文件对象以后,所有的对文件的操作都应该通过对象来进行。
    read() 方法,用来读取文件中的内容,它会将内容全部保存为一个字符串返回。
content = file_obj.read()
  1. 关闭文件
    close() 方法关闭文件;
file_obj.close()

为避免文件打开,忘记关闭占用系统内存的情况,可以使用 with...as... 结构;
在with语句中可以直接使用file_obj来做文件操作
文件只能在 with 中使用,一旦with结束则文件会自动 close()

file_name = 'demo.txt'

try:
    with open(file_name) as file_obj :
    	# 此时这个文件只能在with中使用,一旦with结束则文件会自动close()
        print(file_obj.read())
except FileNotFoundError:
    print(f'{file_name} 文件不存在~~')

1.3 文件的简单读取

1.3.1 基本用法

调用 open() 来打开一个文件,可以将文件分成两种类型:

  • 纯文本文件(使用utf-8等编码编写的文本文件);
  • 二进制文件(图片、mp3、ppt等这些文件);

open() 打开文件时,默认是以文本文件的形式打开的,但是 open() 默认的编码为 None ,所以处理文本文件时,必须要指定文件的编码。指定编码之后就可以读取中文文本文件了。

with open(file_name, encoding='utf-8') as file_obj:

1.3.2 大文件读取

如果直接调用 read() 它会将文本文件的所有内容全部都读取出来。如果要读取的文件较大的话,会一次性将文件的内容加载到内存中,容易导致内存泄漏,所以对于较大的文件,不要直接调用 read()

那么如何解决?查看一下帮助:

file_name = r'C:\demo.txt'
try:
    with open(file_name, encoding='utf-8') as file_obj:
        help(file_obj.read)

except FileNotFoundError:
    print(f'{file_name}文件不存在!')

输出:

Help on built-in function read:

read(size=-1, /) method of _io.TextIOWrapper instance
    Read at most n characters from stream.
    
    Read from underlying buffer until we have n characters or we hit EOF.
    If n is negative or omitted, read until EOF.

有输出信息可知:read() 可以接收一个 size 作为参数,该参数用来指定要读取的字符的数量,默认值为 -1,它会读取文件中的所有字符。我们可以为 size 指定一个值,这样 read() 会读取指定数量的字符,每一次读取都从上次读取到位置开始读取,如果字符的数量小于 size,则会读取剩余所有的;如果已经读取到了文件的最后了,则会返回“空串”。

注意:文本中的换行字符也会被计数!

file_name = r'D:\AliyunEDU\Part6-Python\03 函数 面向对象 异常处理\demo2.txt'
try:
    with open(file_name, encoding='utf-8') as file_obj:
        #help(file_obj.read)
        content = file_obj.read(-1)
        print(f'文本内容为:\n\n{content}\n') # f-字符串格式化
        print(f'文本长度为:{len(content)}')

except FileNotFoundError:
    print(f'{file_name}文件不存在!')

输出:

文本内容为:

锄禾日当午
汗滴禾下土
谁知盘中餐
粒粒皆辛苦

文本长度为:23
# 前三句各一个换行(回车)

大文件读取:

# 读取大文件的方式
file_name = 'demo.txt'

try:
    with open(file_name, encoding='utf-8') as file_obj:
        # 定义一个变量,来保存文件的内容
        file_content = ''
        # 定义一个变量,来指定每次读取的大小
        chunk = 100
        # 创建一个循环来读取文件内容
        while True:
            # 读取chunk大小的内容
            content = file_obj.read(chunk)
			
			# 设置循环终止条件
            # 检查是否读取到了内容
            if not content: # content读取完毕会返回空字符串,空字符串为False,取反为True
                # 内容读取完毕,退出循环
                break

            # 查看读取内容
            file_content += content

except FileNotFoundError :
    print(f'{file_name} 这个文件不存在!')

print(file_content)

分块读取,提高大文件读取效率。


1.3.3 readline()

readline() 方法可以用来读取一行内容;

with open(file_name , encoding='utf-8') as file_obj:
    # 读取一行内容
    print(file_obj.readline(), end='')

readlines() 方法用于一行一行的读取内容,它会一次性将读取到的内容封装到一个列表中返回;

import pprint
import os
file_name = 'demo.txt'

with open(file_name , encoding='utf-8') as file_obj:
    # readline()方法可以用来读取一行内容
    # print(file_obj.readline())
    # print(file_obj.readline(),end='')
    
    # readlines()方法用于一行一行的读取内容
    # r = file_obj.readlines()
    # pprint.pprint(r[0])

    for t in file_obj:
        print(t)

1.4 文件写入

open() 打开文件时必须要指定打开文件所要做的操作(读、写、追加);如果不指定操作类型,则默认是读取文件, 而读取文件时是不能向文件中写入的。
读取模式说明:

  • t:表示读取文本文件;
  • b:表示读取二进制文件;

open() 文件读取参数说明如下:

  • r:表示只读的;rt 功能一样;
  • rb:读取二进制文件;
  • w :表示是可写的,使用 w 来写入文件时,如果文件不存在会创建文件,如果文件存在则会截断文件,截断文件指删除原来文件中的所有内容wt 功能一样;
  • a :表示追加内容,如果文件不存在会创建文件,如果文件存在则会向文件中追加内容;
  • x :用来新建文件,如果文件不存在则创建,存在则报错;
  • + :为操作符增加功能;
  • r+ :即可读又可写,文件不存在会报错;'r+b'打开文件而不会被截断;
  • w+
  • a+

write() 方法向文件中写入内容,如果操作的是一个文本文件的话,则 write() 需要传递一个字符串作为参数,该方法会可以分多次向文件中写入内容,写入完成以后,该方法会返回写入的字符的个数。

file_name = 'demo.txt'
# with open(file_name , 'w' , encoding='utf-8') as file_obj:
# with open(file_name , 'r+' , encoding='utf-8') as file_obj:
with open(file_name , 'x' , encoding='utf-8') as file_obj:
    file_obj.write('aaa\n')
    file_obj.write('bbb\n')
    file_obj.write('ccc\n')
    r = file_obj.write(str(123)+'123123\n')
    r = file_obj.write('今天天气真不错')
    print(r)

  • 读取文本文件时,size是以字符为单位的;
  • 读取二进制文件时,size是以字节为单位;
file_name = '敢问路在何方.flac'

with open(file_name , 'rb') as file_obj:
    # print(file_obj.read(100))

    # 将读取到的内容写出来
    # 定义一个新的文件
    new_name = 'aa.flac'

    with open(new_name , 'wb') as new_obj:

        # 定义每次读取的大小
        chunk = 1024 * 100

        while True :
            # 从已有的对象中读取数据
            content = file_obj.read(chunk)

            # 内容读取完毕,终止循环
            if not content :
                break

            # 将读取到的数据写入到新对象中
            new_obj.write(content)

1.5 seek()和tell()

seek() 可以修改当前读取的位置;此时如果再用read()方法,会从修改的位置之后继续读取;
seek()需要两个参数

  • 第一个 是要切换到的位置
  • 第二个 计算位置方式
    可选值:
    1)0 :从头计算,默认值;
    2)1 :从当前位置计算;file_obj.seek(70,1)
    3)2 :从最后位置开始计算;file_obj.seek(-10,2),读取文件最后10个数据;

tell()方法用来查看当前读取的位置;

print('当前读取到了 -->',file_obj.tell())

完整示例:

with open('demo2.txt','rt' , encoding='utf-8') as file_obj:
    # print(file_obj.read(100))
    # print(file_obj.read(30))

    # seek() 可以修改当前读取的位置
    file_obj.seek(9)
    print(file_obj.read())

    # tell() 方法用来查看当前读取的位置
    print('当前读取到了 -->',file_obj.tell())

1.6 其他文件操作

  1. os.listdir() 获取指定目录的目录结构,需要一个路径作为参数,会获取到该路径下的目录结构,默认路径为 . 当前目录,该方法会返回一个列表,目录中的每一个文件(夹)的名字都是列表中的一个元素。
  • os.listdir()os.listdir('.') 功能是一样的;
  • os.listdir('..') 返回当前文件目录上一级三维文件目录下的文件;
  1. os.chdir() 切换当前所在的目录,作用相当于 cdos.chdir('c:/'));
  2. 创建目录:os.mkdir("a") ,在当前目录下创建一个名字为 aaa 的目录;
  3. 删除目录:os.rmdir('abc')
  4. 删除文件:os.remove('aa.txt')
  5. os.rename('旧名字','新名字') 可以对一个文件进行重命名,也可以用来移动一个文件:
    1)os.rename('aa.txt','bb.txt');实现文件重命名;
    2)os.rename('bb.txt','c:/users/34123/desktop/bb.txt');蒋文佳移动到桌面;

此处只列出了一些常用的文件操作,如果在开发过程中有其他的需求,可以查阅官方文档。


参考:https://edu.aliyun.com/course/1782


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章