Debug: django model querysets-> pandas.Dataframe

问题描述

在使用Django 的ORM model时,有时需要将数据导出并转变成pandas DataFrame。正常的流程应该是:

import pandas as pd
from model import testeModel

data = testModel.objects.values()
# .values()返回的是[object1,object2]
df = pd.DataFrame(data)

但是系统一直会报错,出错信息如下:

Traceback (most recent call last)
/usr/local/lib/python3.4/dist-packages/pandas/core/frame.py in __init__(self, data, index, columns, dtype, copy)
    copy=False)
else:
    raise ValueError('DataFrame constructor not properly called!')
ValueError: DataFrame constructor not properly called!

解决方案

虽然报的是值错误,很容易让人以为是data数据错误。

更隐晦的是即时数值格式都正确,还是会报上述错误,调试后发现这个ValueError错误指的是传入的data数据的格式。一直以为是list(例如[{‘name’:’hello’},{‘name’:’world’}]),毕竟print出来就是这个样子,其实testModel.objects.values()返回的实际类型是:

<class 'django.db.models.query.ValuesQuerySet'>

而这个ValuesQuerySet也支持python的for…in…遍历操作,这就是很容易遗漏的地方。知道后简单的格式转换就可以解决:

import pandas as pd
from model import testeModel
# success
data = testModel.objects.values()
df = pd.DataFrame(list(data))
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章