原创 scrapy 下載文件

接到組長需求,在某個網站上搜索“附件”,後下載所有相關文章內的 附件.word 或 附件.pdf 思路: Files Pipeline 在某個Spider中,你爬取一個item後,將相應的文件URL放入file_urls字段中 item被