1、創建對象
Selector類的實現位於scrapy.selector模塊,創建Selector對象的時候,可以將頁面的Html文檔字符串傳遞給Selector構造器方法
2、選中數據
調用Selector對象的xpath或者css方法(傳入xpath或者css選擇器表達式),可以選中文檔中的某一部分
xpath和css方法返回的是一個SelectorList對象,其中包含每個被選中部分對應的Selector對象,SelectorList支持列表接口,可以使用for循環迭代訪問其中的每一個Selector對象
3、提取信息
調用Selector或者SelectorList對象中的方法可以將選中的內容提取出來
extract
SelectorList對象的extract方法會把所有結果收集到一個列表返回給用戶
re
利用正則表達式提取想要的內容
extract_first
返回第一個Selector對象調用extract方法的結果。通常SelectorList對象中只包含一個Selector對象的時候就會調用這個方法
re_first