拉勾網“設計”職位數據分析之用pyecharts畫箱線圖

(前情提要)我爬了拉勾網搜索“設計”職位的招聘信息,Python爬蟲獲取拉勾網招聘信息詳見Python爬蟲獲取拉勾網招聘信息。並用pyecharts畫了地圖Geo,Map,條形圖,餅圖以及詞雲圖。詳見拉勾網“設計”職位數據分析之用pyecharts畫地圖Geo,Map拉勾網“設計”職位數據分析之用pyecharts畫條形圖Bar拉勾網“設計”職位數據分析之用pyecharts畫餅圖(南丁格爾圖玫瑰圖)Pie拉勾網“設計”職位數據分析之用pyecharts畫詞雲圖

接下來畫最後一個圖———箱線圖(其實箱線圖這裏我不是太明白,有點照貓畫虎的意思吧,還需要再多多學習學習)

import pandas as pd
from pyecharts import options as opts 
from pyecharts.charts import Boxplot 
from pyecharts.globals import ChartType, SymbolType,ThemeType
df = pd.read_excel('lagou_sj0309_155511.xlsx')
#處理薪酬數據
    pattern = '\d+'
    # 將字符串轉化爲列表,薪資取最低值加上區間值得25%,比較貼近現實
    df['salarys'] = df['salary'].str.findall(pattern)
    avg_salary_list = []
    for k in df['salarys']:
        int_list = [int(n) for n in k]
        avg_salary = int_list[0] + (int_list[1] - int_list[0]) / 4
        avg_salary_list.append(avg_salary)
    df['月薪'] = avg_salary_list
    #處理工作年限數據
    df['workYears']=df['workYear'].replace({'應屆畢業生':'1年以下','不限':'1年以下'})
    groupby_workyear=df.groupby(['workYears'])['月薪']
    count_groupby_workyear=groupby_workyear.count()
    count_groupby_workyear=count_groupby_workyear.reindex(['1年以下','1-3年','3-5年','5-10年'])
    a = count_groupby_workyear.index
    dff=[]
    for b in a:
        c=groupby_workyear.get_group(b).values
        dff.append(c)
    c = Boxplot(init_opts=opts.InitOpts(theme=ThemeType.LIGHT))
    c.add_xaxis(['1年以下','1-3年','3-5年','5-10年']).add_yaxis("薪酬k/月", c.prepare_data(dff)
        ).set_global_opts(title_opts=opts.TitleOpts(title="不同工作經驗的薪酬分佈"))
    c.render("不同工作經驗的薪酬分佈.html")

不同工作經驗的薪酬分佈

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章