修复错误的word文档的新方法

背景:之前看论文然后写了很多的总结在一个word文档里面,是在ubuntu系统下写的。后来要用Endnote只好进入Windows下操作了,在Windows下访问Ubuntu的分区可以使用Ext2Fsd软件,我利用该软件打开了对应的Ubuntu下的分区,把那个word文档的内容复制出来在Windows下面编辑,然后把原来的又删除了。后来不知道怎么回事,在Windows下编辑的新的那个word文档不见了,然后Ubuntu分区里面的word文档又打不开,提示说内容有错误,也修复不成功,实在着急!

打开word文档发现内容有错误,office的默认修复方式不成功,在百度上也找不到解决办法,怎么办?

其实word文件本质上可以看作是一个压缩文件,里面包含了一些文件夹和xml文件,如下图所示:
这里写图片描述
这里面不仅记录了文档的文字内容,还有其他比如描述文档格式之类的文件,所以,我们关键是要把记录了文字内容的东西找出来,其他的格式都是小事了。

假设有错误的文档名叫corrupt.docx,接下来在Ubuntu下输入命令
$ cp corrupt.docx corrupt.zip
上述命令的意思是将这个文件改成压缩文件,接下来
$ zip -FF corrupt.zip --out new.zip
运行这条命令的原因是前面得到的corrupt.zip可能是有错的,打不开,所以用这条命令来修复它,输出新的压缩文件new.zip。接下来将这个新的压缩文件转化为word文件即可。
$ mv new.zip new.docx
最终得到叫new.docx的新的word文档,能够得到原来的文字内容,不过可能格式会有所变化,但是应该不是特别重要了。

参考链接:
1. fix corrupted word file
2. fix corrupted zip file

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章