'module' object has no attribute 'OP_NO_TLSv1_1'

Twisted 版本不對

安裝Python環境:

sudo apt-get install python-dev

安裝scrapy:

sudo pip install scrapy

安裝twisted:

pip install Twisted==16.4.1

創建新項目:

scrapy startproject name

運行爬蟲:

scrapy crawl spidername


sudo apt-get install libmysqlclient-dev

sudo pip install MySQL-Python


安裝scrapy-random-useragent

sudo pip install scrapy-random-useragent

配置setting.py:

  1. DOWNLOADER_MIDDLEWARES = {  
  2.     'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None,  
  3.     'random_useragent.RandomUserAgentMiddleware': 400  
  4. }  

  1. USER_AGENT_LIST = "/path/to/useragents.txt"  

創建useragents.txt文件
  1. "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1  
  2. (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1  
  3. Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11  
  4. (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11  
  5. Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.6  
  6. (KHTML, like Gecko) Chrome/20.0.1092.0 Safari/536.6  
  7. Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.6  
  8. (KHTML, like Gecko) Chrome/20.0.1090.0 Safari/536.6  
  9. Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.1  
  10. (KHTML, like Gecko) Chrome/19.77.34.5 Safari/537.1  
  11. Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/536.5  
  12. (KHTML, like Gecko) Chrome/19.0.1084.9 Safari/536.5  
  13. Mozilla/5.0 (Windows NT 6.0) AppleWebKit/536.5  
  14. (KHTML, like Gecko) Chrome/19.0.1084.36 Safari/536.5  
  15. Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3  
  16. (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3  
  17. Mozilla/5.0 (Windows NT 5.1) AppleWebKit/536.3  
  18. (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3  
  19. Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_0) AppleWebKit/536.3  
  20. (KHTML, like Gecko) Chrome/19.0.1063.0 Safari/536.3  
  21. Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3  
  22. (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3  
  23. Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3  
  24. (KHTML, like Gecko) Chrome/19.0.1062.0 Safari/536.3  
  25. Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3  
  26. (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3  
  27. Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/536.3  
  28. (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3  
  29. Mozilla/5.0 (Windows NT 6.1) AppleWebKit/536.3  
  30. (KHTML, like Gecko) Chrome/19.0.1061.1 Safari/536.3  
  31. Mozilla/5.0 (Windows NT 6.2) AppleWebKit/536.3  
  32. (KHTML, like Gecko) Chrome/19.0.1061.0 Safari/536.3  
  33. Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/535.24  
  34. (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24  
  35. Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/535.24  
  36. (KHTML, like Gecko) Chrome/19.0.1055.1 Safari/535.24  

scrapy polipo

middlewares.py:
  1. # Importing base64 library because we'll need it ONLY in case if the proxy we are going to use requires authentication  
  2. import base64   
  3. # Start your middleware class  
  4. class ProxyMiddleware(object):  
  5.     # overwrite process request  
  6.     def process_request(self, request, spider):  
  7.         # Set the location of the proxy  
  8.         request.meta['proxy'] = "http://127.0.0.1:8118"  

setting.py:

  1. DOWNLOADER_MIDDLEWARES = {  
  2.     'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware'110,  
  3.     'amazon.middlewares.ProxyMiddleware'100,  

scrapy http status codes

request加上meta={'handle_httpstatus_list': range(400,600)}


scrapy duplicate requestes

request 加上dont_filter = True


django 判斷數據庫是否配置成功

python manage.py shell

from django.db import connection
cursor = connection.cursor()

不報錯爲成功


原文地址:http://blog.csdn.net/u013596119/article/details/71245802

http://blog.csdn.net/u013596119/article/details/71246334

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章