原创 從數據上看:誰纔是漫威的絕對C位

復聯4上映了!這次比美國還早了兩天。當然,我還沒看,不會給你們劇透,當然也不想不劇透。 這一部不僅是滅霸這一線劇情的結局,也被認爲漫威第三階段的收官之作。據說此部之後,不少影迷熟知的角色(演員)就要離開漫威世界的熒幕了。因此剛上映就備受關注

原创 [數讀]從開戶數看這一波牛市

注:本文首發於2019年3月11日。本想等3月的官方報告出來後修正文中數據。但很神奇的是,本文發佈之後,中登公司的每週數據就再無更新。直到近日,公佈了3月的月度數據,確實在意料之中,環比增加了一倍。 最近的股市有點熱鬧:上證指數從2019開

原创 2018電影票房分析-誰纔是票房之王

去年末的時候,我招收了新的“ 實訓生 ”。本文是其中一位 @齊大聖 同學在實訓兩個月時完成的項目案例。(碼上行動羣裏同學應該都看過這個名字,現在也是助教之一。)項目最初的想法是, 從互聯網上的公開信息中採集2018年在國內上映電影的票房、評

原创 北京全年天氣狀況分析

本文來自 @範洺源 投稿,在其基礎上做了點修改 最近在學爬蟲和數據分析,看到 天氣網 上有國內城市一年的天氣歷史數據,想以此爲數據源練習一下,於是就有了這個項目。今天在此簡單介紹一下實現思路和最終效果。 用到的相關庫包括: request

原创 這可能是我用過最“強大”的API:Marvel API

我們在編程教室中寫過不少使用 API 開放接口 的案例,比如: 查詢書影音的 豆瓣 (爬蟲+網站開發實例:電影票比價網) 查詢股票的 tushare (想用 Python 做數據分析?先玩玩這個再說) 翻譯單詞的 詞霸 (【每週一坑解答】

原创 爆款遊戲《貪吃蛇大作戰》的 Python 實現

感覺遊戲審覈新政實施後,國內手遊市場略冷清,是不是各家的新遊戲都在排隊等審覈。媒體們除了之前競相追捧《Pokemon Go》熱鬧了一把,似乎也聽不到什麼聲音了。直到最近幾天,突然聽見好幾人都提到同一個遊戲,網上還有人表示朋友圈被它刷屏了。(

原创 Python 抓取網頁亂碼原因分析

在用 python2 抓取網頁的時候,經常會遇到抓下來的內容顯示出來是亂碼。 發生這種情況的最大可能性就是編碼問題: 運行環境的字符編碼和網頁的字符編碼不一致。 比如,在 windows 的控制檯(gbk)裏抓取了一個 utf-8 編碼的網

原创 BeautifulSoup:網頁解析利器上手簡介

關於爬蟲的案例和方法,我們已講過許多。不過在以往的文章中,大多是關注在 如何把網頁上的內容抓取下來 。今天我們來分享下,當你已經把內容爬下來之後, 如何提取出其中你需要的具體信息 。 網頁被抓取下來,通常就是 str 字符串類型的對象 ,要

原创 爬蟲+網站開發實例:電影票比價網

注:一篇去年的舊文,發現沒在知乎發過,過來補個檔。有個小問題是項目中淘票票的網頁反爬提升且變動較多,目前暫不可用了。 時常有同學會問我類似的問題:我已經學完了 Python 基礎,也照着例子寫過一點爬蟲代碼 / 瞭解過 django 的入門

原创 爲了邊看美劇邊學英語,我寫了個字幕處理腳本

每個英語學渣(好吧,其實這個說的就是學渣本渣了♀)都有這樣一個夢想: 能夠一邊輕鬆愉快地看着美劇,一邊自己的英語聽力水平還能蹭蹭地往上漲 。知乎上也有很多人分享了自己通過美劇練習聽力的方法,比如說 只開英文字幕 或者 乾脆就不要字幕 。但是

原创 對比幾段代碼,看看你是 Python 菜鳥還是老鳥

Python 裏有個小彩蛋: 在 Python Shell 裏輸入 import this 這段話被稱作“ Python 之禪 ”( The Zen of Python ),它列舉了一些 Python 所推崇的理念,比如: 優美 勝於醜

原创 如何用100行Python代碼做出魔性聲控遊戲“八分音符醬”

最近幾天,一款魔性的小遊戲在微博上刷屏了,各大平臺的主播也紛紛如感染病毒一樣直播自己怎麼玩這個遊戲(被遊戲玩)。 這個遊戲叫做《不要停!八分音符醬♪》。它是一款來自島國的惡搞遊戲,主角是一隻可愛的小生物 — 八分音符醬,玩家通過對它喊話來控

原创 排序算法可視化演示

算法 是編程知識體系中的重要部分。當你已經掌握了一些編程基礎之後,必然需要了解算法相關的知識,才能可以寫出效率更高的代碼。而 排序算法 又是算法中非常基礎的內容。 我們用 Python 實現了一個 可視(聽)化的排序算法演示 程序,給你們直

原创 ORM-像對象一樣對待數據

咱們編程教室有不少同學,學完了基礎課程,掌握了一定的編程能力,開始做項目了。然後很可能遇到一個問題:管理數據。課程裏有講過用文件保存數據,還有 pickle 、 csv 等模塊輔助。但對於稍微複雜一點的數據,往往不夠方便。成熟的解決方案就是

原创 Python-Excel 模塊哪家強?

0. 前言 從網頁爬下來的大量數據需要清洗? 成堆的科學實驗數據需要導入 Excel 進行分析? 有成堆的表格等待統計? 作爲人生苦短的 Python 程序員,該如何優雅地操作 Excel? 得益於前人的辛勤勞作,Python 處理 E