Scrapy學習過程之五:item

參考:https://docs.scrapy.org/en/latest/topics/items.html#scrapy.item.Item

Scrapy architecture

SPIDER將從網頁中提取出來的數據以dict的形式發射出去,這個dict直接寫在代碼中,很容易寫錯,也不能複用。

因此Scrapy專門提供了一個類item class,用來專門定義dict的結構,比如包含那些字段名等。這樣集中管理不容易出錯,出錯也容易修改,可以復——提供了很多有用的存取器。

Declaring Items

import scrapy

class Product(scrapy.Item):
    name = scrapy.Field()
    price = scrapy.Field()
    stock = scrapy.Field()
    tags = scrapy.Field()
    last_updated = scrapy.Field(serializer=str)

就是定義了一個專門用於存取數據的類,然後調用相關的方法就可以存取數據了,有點像JAVA BEAN。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章