原创 Python爬蟲怎麼入門-讓入門更快速,更專注

經常有同學私信問,Python爬蟲該怎麼入門,不知道從何學起,網上的文章寫了一大堆要掌握的知識,讓人更加迷惑。 我也瀏覽了下網上關於怎麼Python爬蟲入門的文章,發現有的還在教人用urllib來發送http請求,這真是有點誤人子弟了。本文

原创 Python爬蟲的法律邊界(二)小爬怡情,大爬over!

數據抓取的門檻越來越低,會點程序,或使用網絡工具都可以薅點數據,新入行了不少爬蟲選手,但是對抓取使用數據的法律風險可能缺少認識。尤其是從去年的《網絡安全法》實施開始,被新聞公開報道的相關法律訴訟已有好幾起。 有人會爭議互聯網本質是鼓勵分享

原创 前大疆程序員離職後,把代碼上傳 GitHub,令公司損失百萬,獲刑半年!

該員工之前在大疆的子公司擔任軟件工程師,公司對他很器重,負責編寫農業無人機的管理平臺和農機噴灑系統代碼。他在Github 開設賬號,並建立了“公有倉庫”,把代碼上傳至了 GitHub 公有倉庫。 經鑑定,大疆這些泄露出去的代碼具有非公知性,

原创 Python爬蟲技術不只是用來抓數據,生活處處需要python

寫爬蟲抓數據只是爬蟲技術的應用方向之一,一個公司可以靠着爬蟲技術引來倍增的流量/用戶, 完成關鍵的冷啓動,還能用來打敗對手;個人可以利用爬蟲技術獲得被動收入,俗稱趟掙。 這篇聊一下公司篇。 定義下爬蟲技術 爲了抓數據所運用的模擬登錄、模擬

原创 Python爬蟲的法律邊界(一)爬蟲有風險,開爬要謹慎!

來交代一下,你抓了多少數據,在哪抓的,幹什麼用了,看夠在裏面待幾年。 從去年開始我看到好幾起因爲抓取數據而遭遇訴訟,有的鋃鐺入獄,有的被處罰金,從案件的模糊描述來看,我看得後背發涼,似乎每個爬蟲選手都有被KO的風險。 這幾個月也停止了幾個抓

原创 Python爬蟲者的福音!一個神庫,彙總了數十個主流網站的模擬登陸方法

網絡上有形形×××的網站,不同類型的網站爬蟲策略不同,難易程度也不一樣。從是否需要登陸這方面來說,一些簡單網站不需要登陸就可以爬,比如之前爬過的貓眼電影、東方財富網等。有一些網站需要先登陸才能爬,比如知乎、微信等。這類網站在模擬登陸時需要

原创 Python程序員段位自測:奮鬥許久,你是青銅還是王者?

Python的使用場景實在太豐富,從入門編寫各種小程序,到爬蟲、到全棧、到自動化、到大數據、到AI,各式各樣的場景中都能看見Pthon的身影。這樣一門擁有光明前景的語言,他的使用者應該如何劃分段位呢? 青銅 對不起,我只能算是臥底。

原创 Python 太糟糕了?開發者總結了 8 大原因

有開發者發文表達了他覺得 Python 不行的 8 大原因。 作者對每一項“缺點”都進行了分析,全文洋洋灑灑,概括起來 8 個原因分別是: 1、版本不兼容 Python 3 與 Python 2 不完全兼容。作者以 Perl 語言和創造了

原创 Python生成抖音字符視頻,技術流!

抖音字符視頻在去年火過一段時間。 反正我是始終忘不了那段極樂淨土的音樂... 這一次自己也來實現一波,做一個字符視頻出來。 主要用到的庫有cv2,pillow庫。 原視頻,直接抖音下載的,妥妥的水印。 / 01 / 視頻轉圖片 在Pych

原创 劍走偏鋒,robots.txt快速抓取網站的小竅門

在我抓取網站遇到瓶頸,想劍走偏鋒去解決時,常常會先去看下該網站的robots.txt文件,有時會給你打開另一扇抓取之門。 寫爬蟲有很多苦惱的事情,比如: 1.訪問頻次太高被限制; 2.如何大量發現該網站的URL; 3.如何抓取一個網站新產生

原创 人人學Python,爲什麼就業拿高薪的那麼少?

Python語言相關的崗位非常多,有運維,有自動化測試,有後端開發,有機器學習,人工智能,python無所不能。 市場上需要的Python人員非常多,而且按照現在的勢頭,以後會需要更多的Python開發人員,理由是以後每個人公司都會有自己

原创 Python 算法大全,GitHub Star 超過 2 萬

4 月 27 日,GitHub 趨勢榜第 3 位是一個用 Python 編碼實現的算法庫,Star 數早已達到 26000+ 鏈接:https://github.com/TheAlgorithms/Python 這個庫涵蓋了多種算法和數據

原创 三行代碼把女朋友照片變成了素描圖片!人生苦短,愛python多一些

我們知道圖片除了最普通的彩×××,還有很多類型,比如素描,卡通,黑白等等,今天就介紹如何使用python和opencv來實現圖片變素描圖。 首先將彩×××轉換成灰度圖; 對灰度圖進行求其反色的操作; 對第2步得到的結果採用一個高斯模糊的操作

原创 最全面的Pandas的教程!沒有之一!

Pandas 是基於 NumPy 的一個開源 Python 庫,它被廣泛用於快速分析數據,以及數據清洗和準備等工作。它的名字來源是由“ Panel data”(面板數據,一個計量經濟學名詞)兩個單詞拼成的。簡單地說,你可以把 Pandas

原创 零基礎學Python,越早明白這些,越快找到好工作!

如何學習python,就能僅靠python得到好工作? 讀者A:自學python一年,用於寫網絡爬蟲,但一直覺得自己對python理解還很低層。現在大三,打算再用一年時間學習python,讓自己對這們語言有真正的理解,並且還能依靠它得到大公