原创 數據分析入門之KNN-預測年收入

文章目錄1、導入數據2、數據預處理2.1、選擇數據2.2、數據轉化2.2.1、轉化字典2.2.2、數據映射3、訓練數據3.1、切分訓練集和測試集3.2、訓練並預測數據4、歸一化處理4.1、最大值最小值歸一化4.2、方差標準化5、保

原创 機器學習之KNN-手寫數字識別

文章目錄1、讀取數據1.1、導入相關庫1.2、讀取一張圖片測試1.3、讀取所有圖片2、數據預處理2.1、list轉numpy2.2、添加對應數字3、隨機抽取訓練集與測試集4、訓練模型並預測4.1、訓練模型4.2、預測4.3、計算準

原创 報表做得讓人難受可能是你不瞭解 Python pyecharts 數據可視化操作

當python 遇見 Echarts , 就產生了pyecharts,pyecharts 是一個用於生成 Echarts 圖表的類庫。Echarts 是百度開源的一個數據可視化 JS 庫。用 Echarts 生成的圖可視化效果非

原创 python scipy庫基礎學習(圖片消噪, 求解圓周率, Scipy文件輸入/輸出, scipy矩陣)

文章目錄1、登月圖片消噪1.1、導入圖片1.2、查看圖片信息1.3、進行傅里葉變換1.4、計算平均值並過濾大的值1.5、反轉變換1.6、顯示該圖片1.7、把圖片變白2、數值積分,求解圓周率2.1、首先畫一個圓2.2、求圓的面積3、

原创 疫情期間,我用python輔助統計班級打卡信息

前言:由於全國受到新型冠狀病毒的影響,我們學校在已有的學工系統開發了 “每日一報”和“i簽到” 兩個功能來記錄學生的身體狀況和位置信息,確保並監督學生無誤填寫,每天輔導員都要多次從系統中導出今日打卡記錄,並讓班長提醒未打卡同學打

原创 圖像處理之opencv保存視頻+wave保存音頻+ffmpeg合併

文章目錄1、opencv保存視頻1.1、讀取並展示視頻1.2、灰色處理1.3、調整視頻大小——分辨率1.3.1、查看視頻的分辨率1.3.2、調整視頻的分辨率1.3、保存視頻1.3.1、設置保存對象參數1.3.2、調用寫入函數保存1

原创 《汽車之家》字體反爬之論壇、問答、文章(新聞、車家號)及其評論爬取

剛過年,又要到了一年一季的畢業季,馬上就要到了大四學長學姐們提交畢業論文的時節,這次爬《汽車之家》的文章就是幫一位學長準備畢業論文研究資料。汽車之家的反爬蟲措施做得很好,用了字體反爬技術。對於這類的反爬技術,我上次在幫另一位學長

原创 數據分析入門之Matplotlib數據可視化基礎(散點圖、折線圖、直方圖、餅圖、箱線圖)

文章目錄1、掌握pyplot基礎語法1.1、基本繪圖流程1.2、創建畫布與創建子圖1.2.1、設置畫布大小1.2.2、添加圖列1.2.3、解決中文亂碼1.3、添加畫布內容1.4、保存與展示圖形1.5、查看本地文件夾2、繪製散點圖2

原创 python selenium 爬取《全國農產品商務信息公共服務平臺》

這是我參與的第二個項目,進程還是很順利的。這也不斷改進的過程,總共有三個版本: 第一個版本是普通的爬取,對於某個農產品關鍵詞,獲取它全部的內容,後來由於我的網速太差,python運行報錯了,每個農產品都擁有八百多個頁面,如果重

原创 python爬蟲實戰之爬取中國農藥網

前言:這算是和研究生老師第一次正式的進行項目,雖說開始的有點隨便,但是第二戰還是挺成功的!自己作爲一個本科生,也很幸運可以跟着學點知識,隨便幫自己學院的老師出點力。還記得第一次交接任務時是和陳瑞學長,初戰《貴州農經網》,還算成功

原创 數據分析入門之Numpy讀寫與統計分析

文章目錄1、讀寫二進制文件1.1、創建兩個隨機數組1.2、使用save保存單個數據1.3、使用savez保存多個數據1.4、使用load讀取數據2、讀取文本格式的數據2.1、savetxt函數2.2、loadtxt函數2.3、ge

原创 數據分析入門之Numpy數組對象學習

文章目錄1、掌握 NumPy 數組對象 ndarray1.1、 數組屬性:ndarray(數組)是存儲單一數據類型的多維數組。1.2、數組創建1.2.1、重新設置數組的 shape 屬性1.2.2、使用 arange 函數創建數組

原创 數據分析入門之使用scikit-learn構建模型

文章目錄1、使用sklearn轉換器處理數據1.1、加載datasets模塊中數據集1.1.1、加載波士頓房價信息1.2、將數據集劃分爲訓練集和測試集1.2.1、常用劃分方式1.2.2、K折交叉驗證法1.2.3、train_tes

原创 圖像處理之KNN+CNN數字識別

文章目錄OpenCV-TensorFlow 入門人工智能圖像處理1、KNN數字識別1.1、load Data1.2、knn test train distance 5*500=2500距離1.3、knn k個最近的5張測試圖片和5

原创 python爬蟲項目之攜程網、大衆點評和馬蜂窩貴州景點差評實戰彙總

這是幫忙工商學院研究生院旅遊管理專業的舒老師弄的一個爬蟲項目,簡單的說算是三個網站一起的爬蟲,分別爬取攜程網、大衆點評和馬蜂窩馬蜂窩的差評信息,僅限於差評,用於論文研究;上次曾有幸受他邀請,教研究生學長學姐們怎麼用python做