原创 python 爬取unsplash網站的圖片

首先,我們打開該網站https://unsplash.com/,發現,這個網站是動態網站 但是,不要慌張,我們看看他的網頁結構,用Network打開看看相關信息 我們發現了這樣的一個鏈接 咦,很明顯,這個是圖片的顯示的頁數和其

原创 本地sql文件,導入進數據庫 python

本地的sql文件,怎麼導入mysql數據庫呢? 第一,我們要有mysql這個軟件,詳細教程百度。 然後,我們進行數據庫添加文件 進入cmd,輸入(記得添加環境變量) net start mysql 打開我們數據庫 然後,登錄我們

原创 python 中文路徑 pandas

在用pandas時,導入數據有中文路徑的文件,出現 FileNotFoundError: [Errno 2] File b’\xe2\x80\xaae:/\xe6\xa1\x8c\xe9\x9d\xa2/Python/test.

原创 貓眼爬蟲三-終極篇:破解滑動驗證,動態字體加密

前面兩節我們對貓眼網站進行了爬取,中間,我們會遇到各種反爬蟲,包括滑動驗證和字體加密等等,今天,我們就對這些反爬蟲進行一一破解,實現貓眼網站的全信息爬取! 1、滑動驗證:滑動驗證類似於極驗證(滑塊驗證,電腦的B站登陸要滑動的哪個)

原创 貓眼爬蟲一-榜單爬取簡單數據爬取,數據庫存入

貓眼是一個很有影響力的電影數據分享平臺,今天,我們要對這個網站的數據進行爬取,當然了,這個只是最初級的數據爬取,後面我會對該網站的加密數據進行爬取,希望能繼續關注。 貓眼爬蟲:爬取評分前100的電影並存入數據庫 爬取數據前準備:先

原创 python pandas series 轉存類字典 格式再獲取

在我們使用pandas進行數據分析時,有時候需要對Series型數據進行拆解,導出,最簡單的方法是導出爲csv格式: df=pd.DataFrame(series) df.to_csv('./df.csv') 現在我們把數據導出

原创 python 學習 爬取證券之星的股票信息

python 學習 爬取證券之星的股票信息 選擇原因,數據好獲取,便於操作! 第一步,找到股票相關的信息,先去東方財富網,找到股票的代碼查詢一覽表網站 ![在這裏插入圖片描述](https://img-blog.csdnimg.c

原创 python入門 小甲魚 第十八課 子字母串在目標字符串中共出現幾次

python 子字母串在目標字符串中共出現幾次? 題目: 編寫一個函數findstr(),該函數統計一個長度爲2的子字符串在另一個字符串中出現的次數。例如:假定輸入的字符串爲 str1=“You cannot improve

原创 python txt文件切割問題

原文鏈接:https://blog.csdn.net/liulinxs/article/details/99459879 最近看小甲魚視頻,學到了文件切割方面的知識,尤其是split的用

原创 完美解決 谷歌chrome 的Flash與您的地區不相容

一:爲什麼需要Flash插件,別的怎麼不要? 事實上只要播放視頻(當然現在許多網站開始使用HTML5方案)就需要啓用Flash插件,一些軟件的功能也需要它的支持;如QQ聊天軟件等。 IE瀏覽器使用的是AX版本flash,win10系統