原创 Python爬取糗事百科所有段子

import requests from lxml import etree import time headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) A

原创 獲取糗事百科文字欄目所有用戶ID

import requests from lxml import etree import time headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) A

原创 LXML庫簡單使用

import requests from lxml import etree headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/53

原创 Xpath語法

我們將在下面的例子中使用這個 XML 文檔: <?xml version="1.0" encoding="ISO-8859-1"?> <bookstore> <book> <title lang="eng">Harry Potter

原创 re模塊

search()方法此方法是在整個字符串中查找滿足匹配條件的字符或者字符串,一旦找到一個就不再繼續查找,並返回包含查找值的對象,可以用.group()方法進行查看,如下: >>> import re >>> str = 'one1two2t

原创 正則表達式基礎

一般字符. 匹配任意字符\ 轉義字符[...] 字符集,相當於在其中任意選擇一個字符進行匹配;在如a[bcd]可以匹配爲ab,ac,或者ad。 預定義字符\d 匹配一個數字字符,0-9;相當於[0-9] >> str = 'dda32fs

原创 BeautifulSoup庫未寫明解析器警告

from urllib.request import urlopen from bs4 import BeautifulSoup html = urlopen("http://www.pythonscraping.com/pages/pag

原创 爬取小豬短租網信息

# -*- coding: utf-8 -*- import time import lxml import requests from bs4 import BeautifulSoup headers = {'User-Agent':

原创 BeautifulSoup庫findAll()、find()方法詳解

find()和findAll()官方定義如下: findAll(tag, attributes, recursive, text, limit, keywords) find(tag, attributes, recursive, text

原创 爬取酷狗音樂華語新歌榜前100

import requests import time import lxml from bs4 import BeautifulSoup headers = { 'User-Agent': 'Mozilla/5.0 (Windo

原创 xshell無法連接虛擬機服務器的解決方案

排錯過程:1:xshell客戶端 ping 服務器IP 看物理鏈路是否暢通;2:xshell客戶端 telnet 服務器IP 22 看ssh默認端口22是否開通3:服務器端查看防火牆是否開啓? 命令:#/etc/init.d/ipt

原创 Python基礎教程—2019/1/29

2019/1/29 // 整除** 乘方0x 十六進制 0b 二進制 0o八進制 常用模塊和函數1:pow() 乘方 >> pow(2,3)8>> 2**38>> 2:abs() 絕對值 3:round() 向最接近的那個數取整,