原创 爬取貓眼電影網經典電影TOP100信息Markdown效果展示

No:1 霸王別姬 主演:張國榮,張豐毅,鞏俐 上映時間:1993-01-01(中國香港) 評分:9.6 瞭解更多… No:2 肖申克的救贖 主演:蒂姆·羅賓斯,摩根·弗里曼,鮑勃·岡頓 上映時間:1994-10-14(美國) 評分

原创 Python爬蟲(三):爬取貓眼電影網經典電影TOP100信息並存入本地Markdown文件(上)

運行環境:Python3.6.2、Pycharm2017.2 附此爬蟲代碼GitHub地址:https://github.com/IMWoolei/MaoYanMovies ==>【效果鏈接】 正文 分析 需要獲取的信息 進

原创 Python爬蟲(二)之使用標準庫爬取糗事百科段子

前言 操作環境:Python3.6,PyCharm2017.3 作爲爬蟲入門練手必爬作業——爬取糗事百科段子,相對來說比較好爬取。之前用BeautifulSoup模塊爬取過,這次擺脫第三方庫,使用標準庫來實現一下。 代碼塊(一)獲取

原创 Python爬蟲(四):爬取136書屋小說,並保存至本地文本文件中,單進程多進程對比效率(以三生三世十里桃花爲例)

運行環境:Python3.6、Pycharm2017.3、Windows10 RS3、requests2.18.4、BeautifulSoup4.6.0 GitHub地址:https://github.com/IMWoolei/

原创 Python獲取網頁編碼的兩種方法——requests、chardet

運行環境:Python3.6、requests2.18.4 方法一:使用requests模塊 In[2]: import requests In[3]: res = requests.get('http://baidu.com') I

原创 Linux中Ctrl Z和Ctrl C的區別

參考來源:http://www.pythontip.com/blog/post/13123/ 兩者區別 關於Ctrl+Z和Ctrl+C這兩個命令,他們都是中斷命令,但是他們的作用卻不一樣。 Ctrl C是強制終止程序的執行並結束進

原创 Python爬蟲(一)之獲取代理IP

設置代理IP的原因 我們在使用Python爬蟲爬取一個網站時,通常會頻繁訪問該網站。假如一個網站它會檢測某一段時間某個IP的訪問次數,如果訪問次數過多,它會禁止你的訪問。所以你可以設置一些代理服務器來幫助你做工作,每隔一段時間換一個代理

原创 Python爬蟲(三):爬取貓眼電影網經典電影TOP100信息並存入本地Markdown文件(下)

運行環境:Python3.6.2、Pycharm2017.2 附此爬蟲代碼GitHub地址:https://github.com/IMWoolei/MaoYanMovies ==>【效果鏈接】 上一篇博客【鏈接】 正文 Mar

原创 MySQL學習筆記(六):MySQL中查看和修改表的存儲引擎

查看系統支持的存儲引擎 SHOW ENGINES; mysql> SHOW ENGINES; +--------------------+---------+--------------------------------------

原创 補充:批量下載百度貼吧圖片Demo

之前在我的一篇博客中寫了一個爬蟲小程序,是用於通過接收用戶百度貼吧帖子網址輸入,然後批量下載樓層圖片的一個小爬蟲【博客地址】。 實現特別簡單,都是獲取百度貼吧圖片資源的url信息,不過這次換作用BS4模塊來實現,下面寫了一個小Demo

原创 (已更新)獲取CSDN訪問量、排名等信息存入JSON文件並繪圖進行分析

運行環境: Python3.6、Pycharm2017.2、Windows10 RS4 GitHub地址:https://github.com/IMWoolei/CSDN_GetRange 前言 我的CSDN博客是今年八月份

原创 常用正則表達式彙總—(數字匹配/字符匹配/特殊匹配)

來源於知乎專欄:https://zhuanlan.zhihu.com/p/29619457 這個是我在知乎上看到前輩的專題,裏面的專欄幫助了我很多,推薦大家去看看。 文章底部有很熟悉的一張正則表附圖 1. 校驗數字的表達式 1

原创 MySQL修改root密碼的4種方法(以Windows爲例)

原文內容:http://www.jb51.net/article/39454.htm 方法1: 用SET PASSWORD命令 首先登錄MySQL。 格式:mysql> set password for 用戶名@localhost

原创 MySQL學習筆記(四):MySQL中LAST_INSERT_ID()使用時的注意事項

主要參考博客(一些內容照搬了): - http://zhaohe162.blog.163.com/blog/static/38216797201122411193745/ - http://blog.csdn.net/slv

原创 Python2和Python3中urllib庫中urlencode的使用注意事項

前言 在Python中,我們通常使用urllib中的urlencode方法將字典編碼,用於提交數據給url等操作,但是在Python2和Python3中urllib模塊中所提供的urlencode的包位置有些不同。 對於Python2