數據分析面試、筆試題彙總+解析(三)

接着昨天的面試題,今天解決五六七八題:

  • 新建屬性列,提取日期中的月份
  • 根據id和月份,做數據透視表;分別求出每個id在不同月份的消費筆數、消費總額
  • 合併信息表和數據透視表;按id合併
  • 數據脫敏,將文本信息匿名化
  1. 首先來解決第五題👉:新建屬性列,提取日期中的月份
    在這裏插入圖片描述
    接着要提取日期裏面的月份,這裏有兩種方法,看👇方法一,使用DatetimeIndex()方法:
    在這裏插入圖片描述
    這樣就成功提取了月份的數據出來;這裏掌櫃翻看pandas的官方文檔,裏面有對DatetimeIndex()的用法進行解釋:
    在這裏插入圖片描述
    下面看第二種方法,用split和concat拼接函數,再把只需要的月份列 insert到原始表:
    在這裏插入圖片描述
    在這裏插入圖片描述
  2. 這樣第五題就解決了,接下來是第六題👇:
    根據id和月份,做數據透視表,並分別求出每個id在不同月份的消費筆數、消費總額。

在這裏插入圖片描述
在這裏插入圖片描述
在這裏插入圖片描述
下面是生成數據透視表並統計不同月份的消費總額和次數:
在這裏插入圖片描述
然後掌櫃對統計出來的兩列數據進行的重命名,更好理解:
在這裏插入圖片描述
這樣就得到了題目要求的統計結果,當然,其實不用數據透視表也可以拿到同樣的結果。方法二,用groupby和sum、count函數的方法來統計每月不同id的消費總額和消費筆數:
在這裏插入圖片描述
在這裏插入圖片描述

  1. OK,第六題也解決了,然後是第七題👉合併剛剛得到的數據透視表和原始表,並按id合併!
    下面是要合併的兩個表格:
    在這裏插入圖片描述
    在這裏插入圖片描述
    本以爲是一個簡單的merge就可以搞定,結果發現並不是😂。因爲這裏數據透視表的索引跟原始表是不一致的,需要先進行一個轉換。查閱好多資料後終於在這個問題裏面找到解決辦法如下👇:
    在這裏插入圖片描述
    接着就可以正常合併!
    在這裏插入圖片描述
  2. 七題解決後就剩倒數第二題👉 數據脫敏,對文本進行匿名化。 看示例:
    在這裏插入圖片描述
    上面解法一就是利用切片屬性,再來看解法二:用正則
    在這裏插入圖片描述
    (PS:留下最後一題,明天再來解答!🧐)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章