原创 python實戰,中文自然語言處理,應用jieba庫來統計文本詞頻

模塊介紹 安裝:pip install jieba 即可 jieba庫,主要用於中文文本內容的分詞,它有3種分詞方法: 1. 精確模式, 試圖將句子最精確地切開,適合文本分析: 2. 全模式,把句子中所有的可以成詞的詞語都掃描出來,速度

原创 python簡單應用!用爬蟲來採集天貓所有優惠券信息,寫入本地文件

今天給大家分享一個小網站的數據採集,並寫到excel裏面! 分析網站 目標網站是“小咪購”,這裏有天貓所有的含有購物券的商品信息,我們今天就來抓它吧! 隨便找一段文字,然後點擊右鍵查看網頁源代碼,看看是否存在該文字,如果存在,那麼這個

原创 Python學習,給自己的代碼做個合集,定製自己的桌面軟件!

在學習Python的過程中,經常會寫很多的練手的腳本,那麼有沒有想過,寫到一起呢?當然了,方法有很多,比如寫到web網頁中,做各種跳轉、寫到微信中,各種回覆關鍵字調用,還有今天和大家分享的GUI圖形用戶界面! 構建基本框架 Python

原创 Python老司機手把手帶你寫爬蟲,整站下載妹子圖,一次爽個夠!

其實很多編程語言都可以做爬蟲,例如java、c#、php等等甚至excel都可以抓網頁的圖表,那麼爲什麼我們要用Python呢?它簡單、便捷,而且有好多庫可以選擇,可以說python是寫爬蟲的首選了! 今天就來帶大家寫一個簡單而又完整的爬

原创 python爬蟲零基礎入門——反爬的簡單說明

之前在《如何開始寫你的第一個python腳本——簡單爬蟲入門!》中給大家分享了一下寫一個爬蟲腳本的基本步驟,今天繼續分享給大家在初期遇到的一個很煩人的問題——反爬及處理辦法! 我們的工具及庫爲:python3.6、pycharm、requ

原创 Python爬蟲基礎學習,從一個小案例來學習xpath匹配方法

學習目的是爲了實踐,而實踐又可以加深我們的學習效率,今天給大家帶來了lxml庫的xpath匹配方法的實例!教程大家網上搜索有很多,我們只看實用功能,當然,如果您已經很熟練了,可以跳過不看的! 開始前準備 版本:python3.6 工具:

原创 Python學習,多進程瞭解一下!學爬蟲不會用多進程能行嗎?

python中的多線程其實並不是真正的多線程,如果想要充分地使用多核CPU的資源,在python中大部分情況需要使用多進程。Python提供了非常好用的多進程包multiprocessing,只需要定義一個函數,Python會完成其他所

原创 爲什麼說python入門很簡單,但是在你這很難?

許許多多的朋友在學習python的時候都會有這樣的經歷: 你辛辛苦苦,埋頭苦學了好久基礎知識,甚至書都被翻爛了,但是跟着別人的視頻或者文章寫一個代碼,一運行,一堆一堆的error!於是你又要吭哧吭哧的重新排查 這個知識點我會,爲啥會報錯?

原创 如何開始寫你的第一個python腳本——簡單爬蟲入門!

好多朋友在入門python的時候都是以爬蟲入手,而網絡爬蟲是近幾年比較流行的概念,特別是在大數據分析熱門起來以後,學習網絡爬蟲的人越來越多,哦對,現在叫數據挖掘了! 其實,一般的爬蟲具有2個功能:取數據和存數據!好像說了句廢話。。。 而

原创 用python抓取“3d”彩票數據,怎麼分析你說了算!

快下班了,正好準備去買彩票,就順手寫了2個腳本,一個用來下載最近的彩票數據,一個用來統計彩票數字,分享給大家! 彩票數據獲取並寫入excel表格 數據來源自己看吧~用外鏈通不過。。。 所用庫:xlwt,requests,lxml 有幾點

原创 Python學習彙總,做數據採集的一些小技巧,乾貨滿滿

學習Python也有一段時間了,在學習過程中不斷的練習學到的各類知識,做的最多的還是爬蟲,也就是簡單的數據採集,有采集圖片(這個最多了。。。),有下載電影的,也有學習相關的比如ppt模板的抓取,當然也寫過類似收發郵件,自動登錄論壇發帖,

原创 世界盃快到了,看我用Python爬蟲實現(僞)球迷速成!

還有4天就世界盃了,作爲一個資深(僞)球迷,必須要實時關注世界盃相關新聞,瞭解各個球隊動態,這樣才能在一堆球迷中如(大)魚(吹)得(特)水(吹),迎接大家仰慕的目光! 給大家分享一個快速瞭解相關信息的辦法:刷論壇!我們來一起做個虎撲論壇

原创 神奇的Python,一行代碼能做哪些炫酷的事情?

可能大家在網上已經看過類似的python單行代碼可以實現的功能,比如: 九九乘法表: print(’ ‘.join([’ ‘.join([‘%s*%s=%-2s’%(y,x,x*y)for y in range(1,x+1)]) fo

原创 Python學習,還在用正則或者bs4做爬蟲嗎?來試試css選擇器吧

之前寫的一些爬蟲都是用的正則、bs4、xpath做爲解析庫來實現,如果你對web有所涉及,並且比較喜歡css選擇器,那麼就有一個更適合的解析庫—— PyQuery。我們就用一個非常簡單的小例子來看看css選擇器做爬蟲是怎麼樣的! 安裝 直

原创 Python學習,這些高階函數和高級特性值得一學!

Python語言這麼火,不論是對於剛開始學習的編程小白或者有接觸過其他語言(c/c++/java等等)的同學來說,寫代碼的時候難免會受本身慣性思維或者其他語言的影響!解決問題的思路有的時候會比較單一,其實Python有很多靈活的解法,比如