解决Excel 2007的"有 XML 错误的 /xl/sharedStrings.xml"问题


昨天下班前,在关闭了辛辛苦苦编辑了一天的Excel 2007格式(.xlsx)文档时,心中掠过一丝阴影,重新打开文档,出现了下面的错误:

200906181245295992618.png

选择“是”进行恢复,又出现了下面的错误提示,并且所有文字内容全部丢失了。

200906181245296000710.png


接下来试了一些方法,没有成功,在网上搜索到了相似的案例,这可能还真是excel 2007的一个BUG,而且所有文章都没有给出解决方法,看来文件恢复的希望是没有了。

说说我都做了什么吧:

1)确认了自己使用的确实是.xlsx文档格式,从网上搜索的结果看是Microsoft的专有格式

2)Excel提供的修复方法仅仅是其程序自带的“内容恢复”

3)从网上查到了一篇文档,介绍了.xlsx文档的格式,知道了它其实是zip压缩了的xml文件集合

4)解压后查看 xl/sharedStrings.xml 文件内容,发现自己编写的内容还在。

5)直接用浏览器打开 xl/sharedStrings.xml 发现了这样的错误提示:

200906181245296403134.png

6)意识到可能是<si></si>匹配对有缺失,通过对xl/sharedStrings.xml文件中的<si>和</si>分别进行文本查找,发现2者的数量相差1,</si>少了一个。

7)通过正则表达式替换、过滤得到下面结果,找到了</si>缺失的位置:

200906181245296544766.png

8)到xl/sharedStrings.xml文件中,找到缺少</si>的<si>,手工补齐</si>。

9)用浏览器打开xl/sharedStrings.xml,不再提示错误。

10)把.xlsx的扩展名改为.zip,用Windows资源管理器打开,用修改后的xl/sharedStrings.xml替换旧文件,再把扩展名改回.xlsx。

11)再用excel 2007打开,所有数据恢复了。



---总结---

我遇到的这个错误的本质原因是xl/sharedStrings.xml文件中有不完整的<si></si>匹配对。其他朋友遇到相同的错误,不一定是与我相同的原因造成的。但找到问题原因的思路可以借鉴。希望这篇文档能够对大家有所帮助。



附:我现在改用openOffice编辑重要文档。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章