隨着各行各業都在進行數字化轉型,數據方面的人才也成爲了各家企業招聘的重點對象,不同數據類型的崗位提供的薪資待遇又是如何的?哪個城市最需要數據方面的人才、未來的發展前景與錢途又是怎麼樣的?今天小編抓取了某互聯網招聘平臺上面的招聘信息,來爲大家分析分析。我們大致會講
數據抓取的流程與步驟
數據清洗的流程與步驟
可視化的結果與分析
數據抓取的步驟
我們用Python當中的requests模塊來發送與接收請求,然後用BeautifulSoup模塊也解析返回的數據,代碼如下
解析數據的代碼如下
然後最後將收集到的數據導出到excel當中,代碼如下
小編這次所抓取的崗位分別有“數據分析師”、“數據挖掘工程師”、“數據產品經理”、“大數據開發工程師”以及“數據運營助理”等等,接下來我們就針對所收集到的數據進行清洗與進一步的處理吧
數據的清洗與處理
我們用到的是Pandas模塊,首先先導入所有收集到的數據
我們來看一下最終的數據集長什麼樣子
output
刪除重複項
數據集當中或許存在重複的內容,我們用drop_duplicates()方法來進行重複項的去除
output
刪除缺失值
output
對薪資數據的清洗
接下來爲了方便對薪資數據進行統計分析,我們對此也需要進行相對應的處理
可視化分析結果
薪資的不同
我們先來看薪資上面的差距,根據不同的職位名稱來看,例如我們來看“數據產品經理”這個崗位
output
較多的是集中在20K-40K這個範圍當中,具體我們可以通過下面這個可視化的結果來看
我們可以發現的是整體的市場中“數據產品經理”這個崗位的整體待遇是相對更好一點的,其次便是“數據挖掘工程師”這個崗位,薪資一般也比較容易達到20K-40K之間的區間
哪個城市的需求最多
接下來我們來看一下哪些城市對數據方面的人才需求是最多的,
output
可以看到的是對於數據方面的人才需求最旺盛的仍然是北京,上海排在第二,與此同時呢,杭州在這方面的需求上面已經超過了廣州,位列第四,同時在前十名當中成都、南京以及武漢與西安都紛紛上榜
哪個行業所需要的數據崗位最多呢?
接下來我們來看一下哪個行業所需要的數據方面的人才最多,
output
從上面的結果中看到,除了“數據服務”行業之外,還有“內容諮詢、短視頻”領域、“軟件服務”、“科技金融”、“電商平臺”、“IT技術服務”等領域對於數據方面的人才都有着相當旺盛的需求
對於學歷的要求是什麼樣的呢?
我們來看一下各家公司對於數據方面的人才,在學歷上又有何種要求呢?
output
一般來說僅僅是“本科”的學歷就可以了,當然還有少數的公司對於學歷的要求是侷限在碩士之上
崗位的簡短介紹
各家公司爲了吸引越來越多的人才前往加入公司,也打出了各色各樣的標語,小編做了彙總,並且做成詞雲圖,首先我們用jieba模塊對文本數據進行分詞
接着我們使用stylecloud模塊來進行詞雲圖的繪製
源:關於數據分析與可視化