參考:https://docs.scrapy.org/en/latest/topics/items.html#scrapy.item.Item
SPIDER將從網頁中提取出來的數據以dict的形式發射出去,這個dict直接寫在代碼中,很容易寫錯,也不能複用。
因此Scrapy專門提供了一個類item class,用來專門定義dict的結構,比如包含那些字段名等。這樣集中管理不容易出錯,出錯也容易修改,可以復——提供了很多有用的存取器。
Declaring Items
import scrapy
class Product(scrapy.Item):
name = scrapy.Field()
price = scrapy.Field()
stock = scrapy.Field()
tags = scrapy.Field()
last_updated = scrapy.Field(serializer=str)
就是定義了一個專門用於存取數據的類,然後調用相關的方法就可以存取數據了,有點像JAVA BEAN。