Python 3 dbfread讀寫dbf 文件的時候，float 類型字段解析錯誤

原創

reachHigher

2020-02-21 15:13

傳送門

dbfread GitHub 項目地址

Python讀取dbf文件，轉化爲Pandas DataFrame

問題描述

在用python讀取一個dbf文件時發現有個字段不能正確解析，在調用DBF類的時候

table = DBF(r'D:\Projects\Repo 3\task_files\20191212\dbzqqyfaC17.dbf')
table.fields

發現其中一個字段的 field 長度解析錯誤

DBFField(name='blfz2', type='N', address=179, length=17, decimal_count=12, reserved1=0, workarea_id=0, reserved2=0, reserved3=0, set_fields_flag=0, reserved4=b'\x00\x00\x00\x00\x00\x00\x00', index_field_flag=0)
DBFField(name='blfm2', type='C', address=196, length=3072, decimal_count=0, reserved1=0, workarea_id=0, reserved2=0, reserved3=0, set_fields_flag=0, reserved4=b'\x00\x00\x00\x00\x00\x00\x00', index_field_flag=0)

這樣導致接下來讀取 records 的時候，不能正常解析數據。用excel 打開dbf文件發現 blfm2 其實是 float類型的數據，但是在dbf文件裏卻被錯誤定義成了字符類型（ ‘C’ type）

在查看了源代碼後發現問題出在了 dbf.py 裏 DBF 類的一個方法定義上，當遇到 ‘C’ （character) 類型的字段時，會去修改 field.length, field.decimal_count, 但這並不是我們想要的結果。

解決辦法

將源代碼裏的部分代碼註釋掉，如下所示，親測可行

def _read_field_headers(self, infile):
    while True:
        sep = infile.read(1)
        if sep in (b'\r', b'\n', b''):
            # End of field headers
            break

        field = DBFField.unpack(sep + infile.read(DBFField.size - 1))

        field.type = chr(ord(field.type))
        # 有些字段會出現定義錯誤，所以把這段註釋掉了
        # For character fields > 255 bytes the high byte
        # is stored in decimal_count.
        # if field.type in 'C':
        #     field.length |= field.decimal_count << 8
        #     field.decimal_count = 0

        # Field name is b'\0' terminated.
        field.name = self._decode_text(field.name.split(b'\0')[0])
        if self.lowernames:
            field.name = field.name.lower()

        self.field_names.append(field.name)

        self.fields.append(field)

reachHigher

發佈了66 篇原創文章 · 獲贊 81 · 訪問量 58萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Python 3 dbfread讀寫dbf 文件的時候，float 類型字段解析錯誤

傳送門

問題描述

解決辦法

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

大齡程序員思考

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

WebStorm 創建 Vue 項目

windows server 關閉複雜密碼策略

【常用操作】C++ vscode cpptools 快捷鍵

【環境配置】Visual Studio Code 如何編寫運行 C、C++ 程序？

Windows Server 創建新用戶，取消複雜密碼，並添加管理員權限，

oracle中如果值爲空null則取默認值0，nvl函數

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結