在scrapy中利用Selector來提取數據

1、創建對象

  Selector類的實現位於scrapy.selector模塊,創建Selector對象的時候,可以將頁面的Html文檔字符串傳遞給Selector構造器方法

2、選中數據

  調用Selector對象的xpath或者css方法(傳入xpath或者css選擇器表達式),可以選中文檔中的某一部分

  xpath和css方法返回的是一個SelectorList對象,其中包含每個被選中部分對應的Selector對象,SelectorList支持列表接口,可以使用for循環迭代訪問其中的每一個Selector對象

3、提取信息

  調用Selector或者SelectorList對象中的方法可以將選中的內容提取出來

    extract

      SelectorList對象的extract方法會把所有結果收集到一個列表返回給用戶

    re

      利用正則表達式提取想要的內容

    extract_first

      返回第一個Selector對象調用extract方法的結果。通常SelectorList對象中只包含一個Selector對象的時候就會調用這個方法

    re_first

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章