Python抓取2500份招聘需求,數據顯示未來最喫香的崗位是這個

隨着各行各業都在進行數字化轉型,數據方面的人才也成爲了各家企業招聘的重點對象,不同數據類型的崗位提供的薪資待遇又是如何的?哪個城市最需要數據方面的人才、未來的發展前景與錢途又是怎麼樣的?今天小編抓取了某互聯網招聘平臺上面的招聘信息,來爲大家分析分析。我們大致會講

數據抓取的流程與步驟

數據清洗的流程與步驟

可視化的結果與分析

數據抓取的步驟

我們用Python當中的requests模塊來發送與接收請求,然後用BeautifulSoup模塊也解析返回的數據,代碼如下

解析數據的代碼如下

然後最後將收集到的數據導出到excel當中,代碼如下

小編這次所抓取的崗位分別有“數據分析師”、“數據挖掘工程師”、“數據產品經理”、“大數據開發工程師”以及“數據運營助理”等等,接下來我們就針對所收集到的數據進行清洗與進一步的處理吧

數據的清洗與處理

我們用到的是Pandas模塊,首先先導入所有收集到的數據

我們來看一下最終的數據集長什麼樣子

output

刪除重複項

數據集當中或許存在重複的內容,我們用drop_duplicates()方法來進行重複項的去除

output

刪除缺失值

output

對薪資數據的清洗

接下來爲了方便對薪資數據進行統計分析,我們對此也需要進行相對應的處理

可視化分析結果

薪資的不同

我們先來看薪資上面的差距,根據不同的職位名稱來看,例如我們來看“數據產品經理”這個崗位

output

較多的是集中在20K-40K這個範圍當中,具體我們可以通過下面這個可視化的結果來看

我們可以發現的是整體的市場中“數據產品經理”這個崗位的整體待遇是相對更好一點的,其次便是“數據挖掘工程師”這個崗位,薪資一般也比較容易達到20K-40K之間的區間

哪個城市的需求最多

接下來我們來看一下哪些城市對數據方面的人才需求是最多的,

output

可以看到的是對於數據方面的人才需求最旺盛的仍然是北京,上海排在第二,與此同時呢,杭州在這方面的需求上面已經超過了廣州,位列第四,同時在前十名當中成都南京以及武漢與西安都紛紛上榜

哪個行業所需要的數據崗位最多呢?

接下來我們來看一下哪個行業所需要的數據方面的人才最多,

output

從上面的結果中看到,除了“數據服務”行業之外,還有“內容諮詢、短視頻”領域、“軟件服務”、“科技金融”、“電商平臺”、“IT技術服務”等領域對於數據方面的人才都有着相當旺盛的需求

對於學歷的要求是什麼樣的呢?

我們來看一下各家公司對於數據方面的人才,在學歷上又有何種要求呢?

output

一般來說僅僅是“本科”的學歷就可以了,當然還有少數的公司對於學歷的要求是侷限在碩士之上

崗位的簡短介紹

各家公司爲了吸引越來越多的人才前往加入公司,也打出了各色各樣的標語,小編做了彙總,並且做成詞雲圖,首先我們用jieba模塊對文本數據進行分詞

接着我們使用stylecloud模塊來進行詞雲圖的繪製

源:關於數據分析與可視化

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章