原创 python寫入與讀取數據庫
前面記錄了python基礎,記錄了爬蟲,記錄了數據可視化,記錄了機器學習,下面將瞭解python web,博主看資料學習了2天才看懂了如何通過python讀寫數據庫: 1.相關模塊的導入與安裝: import mysql.connec
原创 python中cookie獲取
在前面學習中,cookie似乎一直沒通,今天發現了一個能夠讀取網頁cookie的代碼,分享給大家,同時記錄,今天寫代碼遇到的一系列問題: python遇到‘\u’開頭的unicode編碼 web信息中常會遇到“\u…\u…”類型的字符
原创 datawhale爬蟲(ip代理相關知識)
ip 什麼是ip: 網絡之間互連的協議外文是Internet Protocol的外語縮寫,中文縮寫爲“網協”。縮寫爲IP。網絡之間互連的協議也就是爲計算機網絡相互連接進行通信而設計的協議。在因特網中,它是能使連接到網上的所有計算機網絡
原创 datawhale爬蟲(丁香網所有數據爬取)
下面直接爬取所有數據: import requests from bs4 import BeautifulSoup url='http://www.dxy.cn/bbs/thread/626626#626626' headers =
原创 機器學習中迴歸分析(多變量)
1.波士頓房產數據(完整) 通過如下代碼即可獲取所有數據 from sklearn.datasets import load_boston boston = load_boston() print (boston.DESCR) 波
原创 datawhale爬蟲(seleniumm自動登陸163郵箱)
selenium 是一套完整的web應用程序測試系統,包含了測試的錄製(selenium IDE),編寫及運行(Selenium Remote Control)和測試的並行處理(Selenium Grid)。Selenium的核心Se
原创 機器學習中迴歸分析(測評函數)
機器學習之迴歸分析(測評函數) 1.波士頓房產數據 scikit-learn自帶波士頓房價集,該數據集來源於1978年美國某經濟學雜誌上。該數據集包含若干波士頓房屋的價格及其各項數據,每個數據項包含14個數據,分別是房屋均價及周邊犯罪
原创 機器學習中迴歸分析(單變量算法實現)
簡單線性迴歸(單變量實現) 1.自動生成數據: 這裏我們使用make_regression生成迴歸模型數據。幾個關鍵參數有n_samples(生成樣本數), n_features(樣本特徵數),noise(樣本隨機噪音)和coef(
原创 datawhale爬蟲(beautifulsoup和丁香網評論爬取)
1.beautifulsoup基礎講解 Beautiful Soup提供一些簡單的、python式的函數用來處理導航、搜索、修改分析樹等功能。它是一個工具箱,通過解析文檔爲用戶提供需要抓取的數據,因爲簡單,所以不需要多少代碼就可以寫出
原创 datawhale爬蟲(get與post)
學習get與post請求 1.get獲取請求:代碼如下: requests: import requests url="http://www.baidu.com" x = requests.get(url)#獲取請求 x.encodi
原创 機器學習中迴歸分析(基礎)
機器學習之迴歸算法梳理(一基礎) 一.機器學習的基本概念 1.有監督學習和無監督學習:如圖: 根據上述圖片,我們可以分析到,如圖所示的散點圖分佈,通過分類和權值計算,最後用一條直線來劃分,構成一個估計準確的數據,這就是機器學習中需要計
原创 python製作詞雲圖
介紹個高大上的玩意:詞雲圖 下面教大家如何製作詞雲圖,代碼很簡單: 先給出代碼: import jieba from wordcloud import WordCloud, ImageColorGenerator from mat
原创 python中代理IP的獲取
在學習爬蟲時,我們經常遇到被限制ip的情況如何獲取,下面我們介紹如何獲取免費ip的方法: 用爬蟲爬取其相關數據: 我們採集的ip網址爲: https://www.xicidaili.com/ 如圖: 下面分析其代碼: from b
原创 css基礎選擇器和優先級
css基礎選擇器 HTML是我們學習的框架,css是我們網頁的樣式,下面我會慢慢了解css等相關組成。 在開始介紹之前,我先給出具體的相關代碼: <!DOCTYPE html> <html lang="en"> <head>
原创 python爬取豆瓣《毒液》影評
python爬取豆瓣《毒液》影評 看了很多很多電影,發現記憶深刻的電影也沒幾個,可感覺毒液這個電影挺讓人回味無窮。 《毒液》,經歷坎坷後,最終過審。並與十一月份9日播出後,在不到一週內就斬獲了超級10億的票房~, 北美市場的口碑爆棚,