Python抓取某相親網站用戶大數據分析【女】

【鄭重聲明】本文章統計數據均來自XX網用戶數據,未通過任何非公開及違法渠道獲取廣大用戶的個人隱私信息!
【技術參考】Python、selenium、pyecharts(自編自寫的python腳本抓取的XX網公開信息)

摘要

喜逢春日佳節之際,受到新型冠狀病毒肺炎的影響,窩在家裏實在難受,爲了防止屁股坐的生瘡,閒來無事爬了爬XX網,本文統計的實際新縣網城緣女性用戶爲176位,VIP用戶未統計在列(原諒本人懶,VIP用戶數據抓取較費功夫),預估計VIP用戶在20人左右,統計的數據具備一定的真實可靠性

婚姻狀況

  • 在所有的統計中,未婚女性佔比在76%,說明離異或喪偶的 用戶佔據相當一部分比例在這裏插入圖片描述

學歷狀況

  • 通過實際的分佈圖可以看出,女生的學歷分佈相對比較均勻,各個階段的比重都很大,但是高學歷的女生比較少,初中及以下的學歷比重也很大
    在這裏插入圖片描述

收入狀況

  • 從餅圖統計的數據來看,廣大女性羣衆的收入都集中在1萬元以下,八千以下佔據絕大多數,說明女同學的收入相比男士還是有所欠缺的,男性通知要想在收入上比的過女生,月收入要達到1萬以上較爲合適,另外在統計的用戶中還存在一個月收入在3萬以上的,有數據造假之嫌疑
    在這裏插入圖片描述

年齡分佈

  • 統計的柱狀圖中,女性用戶均勻集中在24-30歲的年齡段之間,這個時間段正是談婚論嫁的適宜時機,不過比較令人喫驚的是,有相當一部分大齡女青年還沒有實現自己找到另一半的訴求
    在這裏插入圖片描述

身高統計

  • 女生的身高大都集中在160-165CM之間,男性用戶在匹配帥選用戶的時候不要標準太高,不然找不到合適的目標==
    在這裏插入圖片描述

地域分佈

  • 從地圖上統計的數據來看,在省外工作的 男同胞可就慘了,在XX本地工作的男同胞比較有福了,畢竟200個左右的女性用戶,居然有124個用戶在自己的家鄉,在家的男同學們請抓住機會吧 !
    在這裏插入圖片描述

工作種類分佈

  • 從詞雲的分佈上我們可以看到,在這些用戶中,其他職業所佔比重非常多,所謂的其他職業,換個字面意思可能是非固定的職業,另外可以看出,女生從事的行業居多都是教師、行政、銷售等一類的職業,像互聯網、通信一類的技術行業,能遇到同鄉知音的概率幾乎爲0
    在這裏插入圖片描述

女生愛好

  • 此處抓取的數據不多,如下統計的數據僅做參考,想討好女生的,趕緊挑一種臭味相投吧…
    在這裏插入圖片描述

開源參考

  • 現公佈部分開源代碼,感興趣的同行者可以借鑑下
    def drawPie(self):
        pie=(
              Pie()
              .add(
                      "",
                     #[list(z) for z in zip(Faker.choose(), Faker.values())],
                     [list(z) for z in zip(self.xueli, self.xueli_value)],
                     radius=["0%", "75%"],
                 )
                 .set_global_opts(
                     title_opts=opts.TitleOpts(title="學歷分佈"),
                     #==========================================================
                     # legend_opts=opts.LegendOpts(
                     #     orient="vertical", pos_top="15%", pos_left="2%"
                     # ),
                     #==========================================================
                 )
                 .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
             )
          
        pie.render('pie.html')
    def drawMap(self):
        c = (
            Geo()
            .add_schema(maptype="china")
            .add("geo", 
                 [list(z) for z in zip(self.place, self.place_value)],
                 #type_=ChartType.HEATMAP,
                 )
            .set_series_opts(label_opts=opts.LabelOpts(is_show=False))
            .set_global_opts(
                visualmap_opts=opts.VisualMapOpts(is_piecewise=True),
                title_opts=opts.TitleOpts(title="工作地域分佈"),
            )
        )
        c.render('map.html')
        return c    
    def drawLine(self):
        c = (
            Bar()
            .add_xaxis(self.height)
            .add_yaxis("身高", self.height_value)
            .set_global_opts(title_opts=opts.TitleOpts(title="身高分佈", subtitle=""))
        )
        c.render('line.html')
        return c   
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章