原创 圖解pandas的排序sort_values機制

圖解Pandas的排序sort_values函數 大家好,我是Peter~ 在上一篇pandas的文章中已經介紹排名機制中rank函數的使用。其實在實現排名的過程,已經順帶實現了排序的功能;但是pandas中還有一個重要的方法來解決排序問題

原创 圖解pandas的分組groupby機制

8_圖解Pandas的groupby機制 在自己的數據處理分析日常中,經常會遇到對數據的某個字段進行分組再求和或均值等其他操作的需求,比如電商中根據不同的支付用戶、不同的月份、不同的性別、不同的用戶來源進行用戶的畫像細分,來研究不同組用戶的

原创 圖解Pandas的排名rank機制

圖解Pandas的排名rank機制 在我們的生活經常會遇到各種排名問題:學生成績排名、銷售員業績排名、各種比賽排名等。在之前一篇關於SQL的文章-《面試必備:SQL排名和窗口函數》中有提到過如何使用SQL來實現3種主要的排名方式:順序排名、

原创 python實戰用戶增長Cohort分析

大家好,我是Peter~ 本文中介紹的是一種數據分析方法:羣組分析Cohort Analysis。 羣組分析是用於研究用戶行爲和提高增長的分析思路。在本文中,將結合一個數據集Python來實現該分析方法。 本文數據集下載地址:https:

原创 Pandas數據類型操作

7_Pandas數據類型操作 數據處理、分析等操作的首要操作是我們正確地設置了數據類型,筆者自己經常也會遇到數據類型不合理,而造成無法進行後續操作的困境。本文總結了Pandas中進行數據類型轉換的三種基本方法,同時介紹了基於數據類型取數的方

原创 數據處理基石:Pandas數據探索

Pandas數據初探索 本文介紹的是Pandas數據初探索。當我們生成或者導入了數據之後,通過數據的探索工作能夠快速瞭解和認識數據基本信息,比如數據中字段的類型、索引、最值、缺失值等,可以讓我們對數據的全貌有一個初步瞭解。 思維導圖 模

原创 LeetCode-SQL-大的國家

LeetCode-SQL-595-大的國家 大家好,我是Peter~ 本文講解的是LeetCode-SQL的第595題目,題目名爲:大的國家。 難易程度:簡單。之前做的LeetCode-SQL-182-查找重複的電子以爲是最簡單的,沒想到:

原创 LeetCode-SQL-查找重複的電子郵箱

LeetCode-182-查找重複的電子郵箱 大家好,我是Peter。本文講解的是LeetCode-SQL的第182題目,題目名爲:查找重複的電子郵箱。 難易程度:簡單,做完發現是真的簡單。 題目 下面是具體的題目:從給定的表Person

原创 LeetCode-SQL-超過5名學生的課程

LeetCode-596-超過5名學生的課程 今天帶來的是LeetCode for SQL的第三題,主要考察的是group by分組統計和數據去重distinct的用法。 題目 有一個 courses 表 ,有 student (學生)

原创 LeetCode-SQL-收入超過經理的員工

LeetCode-181-超過經理收入的員工 大家好,我是Peter。本文講解的是LeetCode-SQL的第181題目,難易程度:簡單。 題目 Employee 表包含所有員工,他們的經理也屬於員工。每個員工都有一個 Id,此外還有一列

原创 LeetCode-SQL-關聯兩個表

出品:尤爾小屋 作者:Peter 編輯:Peter 開刷 大家好,我是Peter~ 最近要準備開始刷LeetCode上關於SQL部分的練習題了。相信很多人是知道LeetCode的,畢竟太多互聯網公司是從上面抽題目來考察面試者,尤其是算法

原创 LeetCode-SQL-第二高的薪水

LeetCode-176-第二高的薪水 LeetCode for SQL的第二題 題目的具體描述如下: 答案 方法1 方法1思路:第二高的薪水,也就是除去最高薪水之後,在剩下的薪水中找最高的(自己方法); select max

原创 Pandas花樣取數

Wechat:尤而小屋作者:Peter編輯:Peter 大家好,我是Peter~ 今天繼續帶來Pandas的花樣取數技巧,本文中重點介紹的方法: 表達式取數 query、evel filter where、mask 模擬數據 下面

原创 爬蟲數據解析庫-BeautifulSoup4

快速入門BeautifulSoup4 Beautiful Soup 是一個可以從HTML或XML文件中提取數據的Python庫。由於BeautifulSoup是基於Python,所以相對來說速度會比另一個Xpath會慢點,但是其功能也是非常

原创 MySQL時間格式化函數date_format()

MySQL時間格式化函數date_format()用法詳解 DATE_FORMAT() 函數用於以不同的格式顯示日期/時間數據。 語法 DATE_FORMAT(date,format) date 參數是合法的日期;format 規定日期