我通过python-docx读取一个docx文件,路径确认无误的情况下,还是报错了。上代码:
from docx import Document
path = "E:\\Python\\project\\pro1\\fafa.docx"
doc = Document(path)
for para in doc.paragraphs:
print(para.text)
for i in range(len(doc.paragraphs)):
print(str(i), doc.paragraphs[i].text)
tbs = doc.tables
for tb in tbs:
for row in tb.rows:
for cell in row.cells:
print(cell.text)
上错误:
我的这个fafa.docx文件是通过win32com把doc转化为docx的,一直报这个错。
后来我自己通过WPS创建了一个docx,空的,继续运行这个代码,依然报错,我在这个文件中写了几个字,再次运行,成功了。
难道是我通过doc转化成的docx不识别?
先把转化的代码贴上来,找找错误:
# encoding=utf-8
from win32com import client as wc
w = wc.gencache.EnsureDispatch('kwps.application')
doc = w.Documents.Open(r"E:\Python\project\pro1\lala.doc")
doc.SaveAs2(r"E:\Python\project\pro1\fafa.docx", 16) # 问题出在这
其实问题就出在最后一行的第二个参数16上,16代表的存储格式为doc,我应该改成12,12代表的是转存的格式为docx。修改成12后,python-docx就能读取文件了。