原创 python爬蟲實戰(四) python鬼滅漫畫爬取+簡單JS分析

本次爬取僅供學習,無任何商業用途 豬油骨,拿來滷~今天,來分享一下python圖片爬取+簡單JS分析 爬取網址:漫畫地址 (這個網站只更新到188話,實際上已經有200多話了) 目錄一、獲取所有章節URL地址二、解析圖片地址,進行

原创 Excel(一)之VLOOKUP用法集合——你真的會用VLOOKUP函數麼?

VLOOKUP函數可謂是Excel中最受歡迎的函數之一,然而很多小夥伴只停留在基本的用法上,今天給大家分享五種VLOOKUP函數高階用法。 目錄基本用法(一) 模糊查詢(二) 多對一查詢(三) 多列查詢(四) 一對多查詢(

原创 python學習筆記(四) 數據容器—列表、元組、字典、集合概述

        簡單總結一下python中常用的四種數據結構 目錄一、列表二、元組三、字典四、集合 一、列表 創建列表 添加元素(append、extend、insert) append和extend的相同點在於兩者都

原创 python爬蟲實戰(二) selenium切換iframe爬取知網論文

        原以爲知網還挺好爬的,畢竟在八爪魚裏面都是免費的模板。沒想到,爬的時候還真是坑點滿滿啊! 坑點一: 一開始想都沒想,直接css_selector定位,發現數據居然是空的!後來想了一下可能是需要轉iframe,試了一

原创 python學習筆記(二)數據篩選

        無論是在數據分析還是數據挖掘的時候,數據篩選總會涉及到。這裏我總結了一下python中列表,字典,數據框中一些常用的數據篩選的方法。 1.列表         案例一:從一個含有數字0-9的列表中篩選出偶數(奇數)

原创 python爬蟲實戰(三) 免登錄微博超話爬蟲+數據可視化

        微博爬蟲可以不借助selenium,直接用Chrome下的手機端模式打開,找到其封裝的json數據,即可爬取,具體步驟如下。 分析過程         以東野圭吾超話爲例,網址爲微博超話。進入頁面後,使用Chrom

原创 Geoda095i資源分享及wrongmat問題說明

        找了好久的Geoda095i的資源,現在分享給大家(WIN7/WIN 10都可以用!)         鏈接:https://pan.baidu.com/s/1DgOfIowWlInrSEacVwZcJA     

原创 python學習筆記(五) 依概率隨機產生姓氏案例

        生活中,不同的姓氏出現的頻率大不相同。如趙、王、李等姓出現頻率很高,而像東方、慕容這樣的複姓卻很少見到,今天我們就來在python中簡單實現一下上述過程。 要求:姓氏全都按行保存在CNames中,越靠後的姓氏越少見

原创 python學習筆記(一) 數據合併

在python中,我們通常會遇到對矩陣或者數據框進行合併,這裏我總結了一些numpy庫和pandas庫中合併數據的方法。 numpy中的數據合併 基礎知識介紹      在介紹數據合併之前,先說明一下numpy中數組維數的一些

原创 Mysql 啓動錯誤Can't connect to MySQL server on 'localhost' (10061) 解決方法

        一開始爲了省事,不想輸入密碼,在my.ini配置文件中[mysqld]下加了一句skip-grant-tables,然後啓動mysql,輸入命令mysql -u root -p ,結果就報如下錯誤:        

原创 MySQL(一) Python操控mysql批量插入數據

在Python中,通過pymysql模塊,編寫簡短的腳本,即方便快捷地控制MySQL數據庫 一、連接數據庫         使用的函數:pymysql.connect         語法:db=pymysql.connect(h

原创 R、python、MySQL文件讀寫操作彙總

        總結了一下R、python、MySQL常用的文件讀寫操作(其中,R和python中爲了使讀寫操作更加方便,都需要先指定工作路徑) R         指定工作路徑:setwd('file_path') 數據寫入

原创 說好不哭呢?python爬取5000條QQ音樂評論並進行可視化分析

1.數據爬取         python也快學了一個多月了,今天就來分享一下爬取QQ音樂評論的實戰例子吧。以周董的《說好不哭》爲例:         首先打開QQ音樂,搜索說好不哭。翻到評論區後,使用谷歌瀏覽器的檢查功能,找

原创 python學習筆記(六) Pandas數據分析實戰——基於Kaggle電子遊戲銷量數據集

目錄一、數據集初識二、數據讀取與預處理三、描述性統計分析四、時序分析 一、數據集初識 數據量: 共計16598條數據 數據來源:Video Games Sales 數據字段: 字段名 含義 Rank 遊戲排名 N