原创 零基礎學python之文本和編碼問題

字符串是個相當簡單的概念:一個字符串是一個字符序列。問題出在”字符”的定義上。 在2015 年,”字符”的最佳定義是Unicode字符。因此,從Python 3 的str對象中獲取 的元素是Unicode字符 Unicode 標準

原创 簡單應用Selenium+PhantomJS來抓取煎蛋網妹子圖

那天有朋友找我一起抓妹子圖片,像我這麼正派的人,肯定是要抱着學習的目的……打開網頁,哇!又…又要上火了。。。。 話不多說,先看看網頁吧! 熟練的打開網頁,找到妹子圖,然後F12打開開發者工具,定位,ok,圖片地址找到了,so

原创 Python基礎內容:怎樣快速理解if __name__ == 'main'語句

name 是當前模塊名,當模塊被直接運行時模塊名爲 main 。這句話的意思就是,當模塊被直接運行時,以下代碼塊將被運行,當模塊是被導入時,代碼塊不被運行。 相信好多初學者在學習python的過程中,經常會遇到if name

原创 非常適合新手的一個Python爬蟲項目: 打造一個英文詞彙量測試腳本!

最近朋友在苦學英文,但是又不知道自己學的怎麼樣了,直到有一天,他找到了扇貝網,裏面有個“評估你的單詞量”功能非常的好,就推薦給我了! 今天我們就用python做一個小的爬蟲,然後自己寫一個腳本來實現這個功能吧! 目標:打造一

原创 關於一道面試題的極其無聊的python算法實現

題目是這樣的: 某科技公司兩位科學家(甲、乙)去喫飯,坐在一家酒店靠近街道的窗口座位喫飯,在等待上菜的過程中,閒極無聊,甲向乙出了一道猜三個女兒年齡的題目。 甲:我有3個女兒,3人年齡之積等於36; 乙:猜不出來; 甲:3個女兒

原创 Python基礎之格式化輸出函數format()功能詳解

之前發過一篇文章:Python基礎之常用格式化輸出字符詳解 但是呢,有時候我們需要用到多個%的時候,用這個就很不方便了,比如數錯%數量或者一 一對應的時候。。。 這裏補充一個字典方式的格式化輸出字符的辦法 print(“dou

原创 Python爬蟲框架scrapy抓取旅行家網所有遊記!從此出遊不發愁!

Scrapy是一個用 Python 寫的 Crawler Framework ,簡單輕巧,並且非常方便。Scrapy 使用 Twisted 這個異步網絡庫來處理網絡通訊,架構清晰,並且包含了各種中間件接口,可以靈活的完成各種需求。以上是網

原创 自制一個python下載文件的進度條模塊!

我們在做Python爬蟲腳本的時候,往往希望在運行的過程中可以實時查看到我的下載進度!之前我也一直想實現這個功能(絕對不是爲了炫(裝)耀(B)),也查看了很多博客但是各種解決方案都不是很滿意(當然,progressBar和tqdm

原创 新手學python,如何才能更快升職加薪,迎娶白富美,走上人生巔峯

最近在問答裏發現好多諮詢怎麼學習python,或者學習難不難的問題,這裏給大家提幾點建議: 瞭解自己的目標 我開始學編程的時候,連基礎的知識都不知道,小白的很!記得我開始看教材,就是輸入“hello world”的時候,我也是

原创 Python基礎之常用格式化輸出字符詳解

寫代碼的時候經常會遇到使用格式化字符的情況,這裏將常用的三種情況:%s、%d和%f 用代碼給大家詳細說明下: %s 字符串 %d 整型數字 %f 浮點型 好了~格式化字符的輸出就講到這裏了,如果對大家有幫助,點個贊

原创 代碼遇到異常怎麼辦?不要慌,來看看這個!

先引入一個網上找的表格 異常名稱 描述 BaseException 所有異常的基類 SystemExit 解釋器請求退出 KeyboardInterrupt 用戶中斷執行(通常是輸入^C) Exceptio

原创 幾個非常適合新手練習python爬蟲的網頁,總有一款能搞定!

幾個非常適合新手練習python爬蟲的網頁,總有一款能搞定! 話不多說,直接乾貨了! 頭條圖集:抓包獲取json數據 打開今日頭條主頁,搜索小姐姐,或者其他你感興趣的內容,然後點擊圖集 動態加載的json數據就出來了,沒

原创 python有哪些好玩的應用實現,用python爬蟲做一個二維碼生成器

python爬蟲不止可以批量下載數據,還可以有很多有趣的應用,之前也發過很多,比如天氣預報實時查詢、cmd版的實時翻譯、快速瀏覽論壇熱門帖等等,這些都可以算是爬蟲的另一個應用方向! 今天給大家分享一個二維碼生成器的爬蟲版本實現! 爬蟲思

原创 怎麼讓你的代碼更Pythonic?光有技巧可不行,你還需要看這些……

寫代碼如同寫文章,好的文章是反覆修改出來的,代碼也同樣是反覆的重構出來的。今天給大家分享下,怎麼從一個編程學習者變爲一個程序猿(程序媛)!起碼不要讓別人一看你的代碼就知道你是個小菜鳥! 我們通常寫一個代碼,必然會經過一個簡單-難-簡潔的

原创 Python爬蟲,用第三方庫解決下載網頁中文本的問題

還在辛辛苦苦的查找網頁規律,寫正則或者其他方式去匹配文本內容嗎?還在糾結怎麼去除小說網站的其他字符嗎? 先來看看下面2張圖,都是某小說網站的小說內容 怎麼樣,是不是很簡潔!這就是今天給大家介紹的庫,newspaper庫! newsp