原创 Python爬蟲: 爬取鏈家淮安經紀人信息

 Python 爬取鏈家淮安經紀人信息 #爬取鏈家房源經紀人信息 #有xpath解析爬取:人名,負責區域 #定義csv保存函數 1、導入模塊 import requests from lxml import etree import c

原创 Python爬蟲:Q房網房源信息

#爬蟲項目採取xpath解析 #爬取Q房源網的詳情信息並保存爲csv文件 #爬取具體內容有:"小區名稱", "戶型", "面積", "裝修", "樓層", "朝向", #  "售價", "總價/萬", "詳情"  1、導入模塊 impo

原创 Python爬蟲:爬去韓國電視劇信息

最近看韓劇想重溫一下以前看的韓劇 但是就記得劇情 到網站上找了 太多點的太麻煩,網上問了也回答不了 找的幾個片名都不對,所以就想寫個爬蟲爬去某站上所有的韓劇信息,可以方便查找想看的韓劇 爬取具體如下: # 爬去網站韓國電視劇的信息 #

原创 Python爬蟲:正則表達式爬取貓眼電影

#正則表達式爬取貓眼電影 #網址http://maoyan.com #爬取貓眼電影排行前一百名電影 #爬去排名、圖片、片名、演員、時長、得分 1、導入模塊 import requests import re import json 2、

原创 Python爬蟲:爬取我愛我家網二手房源信息

# xpath爬取 # 爬取小區名稱、戶型、地區、售價、總價 1、導入模塊 import requests import csv from lxml import etree 2、創建類 # 創建我愛我家類 class Woaiwoj

原创 scrapy :介紹

scrapy框架 通常用於爬取大數據量的爬取應用上 首先要在電腦上安裝scrapy 可用pip install scrapy  如果不成功就到官網下載在安裝,具體操作不在這寫了 首先創建scrapy項目:scrapy startproje

原创 Scrapy: 爬取我愛我家

1、創建項目 scrapy startproject pachong 創建文件 scrapy genspider woaiwojia 2、編輯items.py 自定義要爬取的字段域 class Pachong2Item(scrapy.I

原创 Python爬蟲:正則表達式爬取校花網

#正則表達式爬取校花網 # 網址 url = 'http://www.xiaohuar.com' #分頁爬取大學校花圖片共16頁640張美圖 1、導入模塊 import requests import re 2、定義頁面爬取函數get_

原创 Python爬蟲:爬取抽屜網

#用xpath爬取抽屜網 #翻頁爬取抽屜網的段子 #爬取內容爲段子的作者、點贊數、評論數、內容 1、導入模塊 import requests import time from lxml import etree 2、#創建保存函數 d

原创 Python爬蟲:爬取城市景點信息

爬取詳情頁面的所有信息 景點名稱,地址 、簡介、類型、時間、門票等 直接就上代碼;  import requests from lxml import etree from multiprocessing.pool import Poo

原创 scrapy:爬取天堂圖片庫

用scrapy爬取天堂圖片庫: 文件目錄 items.py文件:定義字段 import scrapy class ScraPictureItem(scrapy.Item): pic_url = scrapy.Field(

原创 Python爬蟲: 爬取圖片

爬取網上的圖片,爲網站提供圖片豐富的素材 具體爬取過程如下: import requests from lxml import etree # 爬取天堂圖片網圖片 class Picture(object): def __

原创 Python爬蟲:爬取西刺dail

網址: #https://www.xicidaili.com/nn/1 vscode爬取: xpath提取數據:ip,port,local,hidden,kind,check_time 程序是有用, 只是由於過多的請求爬取,最後電腦訪問不

原创 Python爬蟲:多線程爬取盜墓筆記

用到的庫函數 import requests import time from lxml import etree from multiprocessing.pool import Pool 爬取用xpath 爬取 盜墓筆記的標題、章節、

原创 MongoDB數據庫

創建數據庫用於保存爬蟲數據,節省電腦空間 Python對數據庫的基本的操作 鏈接數據前 1、必須確保已經正確安裝了數據庫 2、必須打開數據庫 3、爲了增加視圖效果需下載數據庫可視化軟件 import pymongo # 連接數據庫 cl