原创 scrapy+selenium獲取嗶哩嗶哩排行榜(應援榜)(動態加載)

目標數據:    爬蟲代碼: # -*- coding: utf-8 -*- import scrapy from bilibili_yy.items import BilibiliYyItem import re from sele

原创 python+selenium登陸攜程網(解決滑塊驗證)(新手向)

爬蟲部分:  測試截圖: 點擊驗證碼沒有處理 

原创 python獲取冒險島最新新聞公告(新手向)

import requests from bs4 import BeautifulSoup url = "http://mxd.sdo.com/web6/home/index.asp" headers={'User-Agent': '

原创 python對excel的基本操作(冒險島新聞公告爲例)(新手向)

import requests from bs4 import BeautifulSoup import xlwt import sys def isConnected(): import requests try:

原创 通過開發者工具快速獲得鍵盤鍵代碼

在任意網頁通過按鍵F12打開開發者工具 在打開的開發者工具中鍵入下面的代碼 $('body').keyup(function (event) { console.log(event.keyCode); }); 之後切回

原创 WebStorm HTML實時預覽

瀏覽器安裝JetBrains IDE Support擴展程序 在需要預覽的文件上右鍵選擇調試選項   路漫漫其修遠兮,吾將上下而求索

原创 python獲取酷狗TOP500音樂排行榜(新手向)

import requests from bs4 import BeautifulSoup import xlwt headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64;

原创 python scrapy 獲取NBA東部賽區排名情況

目標數據:   items.py # -*- coding: utf-8 -*- # Define here the models for your scraped items # # See documentation in: #

原创 CSS學習筆記:概述

書寫規範 選擇器與 { 之間必須包含空格 屬性名與之後的 : 之間不允許包含空格,與值之間必須有空格 並集選擇器必須多行 選擇器的嵌套不應大於3級 所有屬性必須另起一行 屬性定義必須以分號結束 代碼書寫採用展開式 全部使用小寫字

原创 python獲取筆趣閣最近更新小說列表

 目標數據: 代碼: import requests from lxml import etree headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64

原创 python獲取豆瓣電影基本電影信息(新手向)

import requests from bs4 import BeautifulSoup import os id = input("請輸入豆瓣電影的ID:") url = "https://movie.douban.com/sub

原创 python獲取30天嘗試新事情文章粗略信息(新手向)

import requests from bs4 import BeautifulSoup import time import csv urls = ["http://30daydo.com/sort_type-new__day-0

原创 python獲取csdn課程基本信息

目標數據: 代碼: import requests from lxml import etree # 爬取地址:https://www.csdn.net/gather_4a/NtDakg1sOC1lZHUO0O0O.html?pag

原创 python獲取小說網站新筆趣閣小說(新手向)

import requests from bs4 import BeautifulSoup import time import os print("爬蟲對應小說網站,新筆趣閣,地址:http://www.xbiquge.la")