原创 PyCharm 常用快捷鍵和設置

一、pycharm常用快捷鍵Ctrl + Alt + L  格式化代碼,自動對齊,自動換行二、pycharm快捷鍵轉自:https://blog.csdn.net/weixin_41059146/article/details/78826

原创 Python2.7中包含unicode字符的字典的輸出問題

1. Python2.7中包含unicode字符的字典的輸出時會出現問題,示例如下:# coding:utf-8 dic = {"city": u"北京"} print dic輸出結果爲:D:\Python2.7\python.exe D

原创 Python轉碼問題的解決方法——illegal multibyte sequence

1.錯誤提示“UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 305: ordinal not in range(128)”(1

原创 豆瓣讀書\豆瓣電影

1. 獲取豆瓣讀書頁信息,網址爲:https://book.douban.com/,代碼如下:# coding:utf-8 import requests from lxml import etree # 1.獲取豆瓣讀書網頁內容 he

原创 BeautifulSoup解析工具與css選擇器使用簡介

# coding:utf-8 import requests from lxml import etree from bs4 import BeautifulSoup import chardet BASE_DOMAIN = "http

原创 Beautiful Soup解析工具簡介

1.HTML解析器有很多種,比如:解析工具 解析速度 難度       BeautifulSoup最慢最簡單lxml快簡單正則最快最難2.Beautiful Soup解析工具的官方文檔鏈接。2.1獲取所有"a"標籤、2.2獲取第2個"a"

原创 你必須記住的30個CSS選擇器

開篇有30個CSS選擇器你必須爛熟於心,它們適應於當今各大主流瀏覽器。1.** { margin: 0; padding: 0; }1234*選擇器選擇的是每一個單一元素。很多程序員用上面的CSS將所有元素的margin和padd

原创 BeautifulSoup解析工具

BeautifulSoup常用的四種對象(Type)BeautifulSoup將複雜的HTML文檔轉換成一個複雜的樹型結構,每個節點都是Python對象,所有對象可以歸納爲4種:Tag、NavigatableString、Beautifu

原创 使用lxml解析HTML代碼

1. 解析html字符串。使用“lxml.etree.HTML( )”進行解析。etree.tostring( )方法可以將htmlelement元素轉化成字符串,可以正常打印出來。示例代碼如下:# --coding:utf-8-- #

原创 CSS選擇器

HTML代碼如下:<!DOCTYPE html> <html> <head> <title>我的HTML代碼</title> <style type="text/css"> p{ background-color: pink

原创 lxml和xpath結合使用

lxml和xpath結合使用主要有以下5個方面內容:# 1.獲取所有的tr標籤# 2.獲取第2個標籤# 3.獲取所有class 等於event的tr標籤# 4.獲取所有a標籤下的href屬性# 5.或許所有的職位信息(純文本)# 6.ge

原创 requests庫的基本使用

1. response.content和response.text的區別response.content是編碼後的byte類型(“str”數據類型),response.text是unicode類型。這兩種方法的使用要視情況而定。注意:un

原创 單例模式-Java

單例模式的特點: 一是某個類只能有一個實例 二是它必須自行創建這個實例 三是它必須自行向整個系統提供這個實例 應用情況:對於多個對象使用同一個配置信息時,就需要保證該對象的唯一性。 如何保證對象的唯一性? 一不允許其他程序用new創建該類