手遊用戶數據分析平臺

目錄:

  1. 項目時間:2019-04 - 2019-08
  2. 技術架構:Hadoop+Flume+HBase+Kafka+Sqoop+Spark+Zookeeper+JDBC+Hive+Mysql
  3. 項目描述:
    1. 該系統是一個用戶行爲分析系統。系統的主要用戶爲公司內部的PM和運營人員,用戶根據自己的需求去分析某一 類客戶的流量數據。根據分析結果,PM可以優化產品設計,運營人員可以爲自己的運營工作提供數據支持。用戶在系統界面中選擇某個分析功能對應的菜單,並進入對應的任務創建界面,然後選擇篩選條件和任務參數,並提交任務。在接收到用戶提交的任務之後,根據任務類型選擇其對應的Spark作業,啓動一條子線程來執行Spark-submit命令以提交Spark作業。Spark作業運行在Yarn集羣上,並針對Hdfs中的海量數據使用SparkSQL進行計算,最終將計算結果寫入Hdfs中。另外還集成Flume,Kafka和Spark,利用SparkStreaming,進行實時分析。用戶通過系統界面查看任務分析結果,將結果返回給界面進行展現。
    2. 遊戲數據的構成分爲四個層面:
      1. 第一層是論壇媒體的數據,這是遊戲外的數據
        1. 廣告投放量分析
        2. 渠道合作分析
      2. 第二層是運營數據(其他作用)
        1. 結論一:在手遊題材方面,手遊公司應該向角色扮演類、休閒益智類、卡牌類遊戲方向靠攏,而由於手機屏幕與PC相比過小、遊戲操作樣式較少等特性,適當減少體育類等題材的遊戲,並非單純地將PC上火爆的遊戲平移到手機上。
        2. 結論二:在推廣策略方面,手遊公司依然應該注重應用分發平臺這個渠道,畢竟絕大部分用戶是通過這個平臺來獲知並下載遊戲。在過去一段時間內,手遊公司在廣告推廣方面無所不用其極——地鐵站、視頻廣告、應用內植入等等,我們都能看到手遊的身影,但調查結果顯示,此舉效果存疑。
        3. 結論三:在收費制度方面,應該謹慎考慮“下載付費”的策略。畢竟在互聯網、移動互聯網時代,“免費”的理念已經深入身心,“下載付費”會阻礙用戶進入到遊戲中。
        4. 結論四:在遊戲設計方面,用戶對遊戲製作的精美程度並無太高的要求,但對裝備、闖關等有較高的付費需求。手遊公司應該在這些方面多加考慮,例如,如何將遊戲關卡設計的更巧妙,如何將裝備對遊戲的影響力做的更好,同時也兼顧平衡。
        5. 結論五:一直以來,手遊輕量化一直是行業的整體現象,因爲手遊本來就佔據着用戶的碎片化時間,不應該過重。但通過數據顯示,超過三成的用戶每天要在手游上花費超過2個小時的時間,這一部分手遊“重度用戶”對重度遊戲存在需求。
        6. 結論六:從消費的角度看,超過半數的用戶已經開始習慣付費,且多數用戶並不計劃改變過去一年的消費習慣——這意味着手遊行業不用擔心大規模的付費用戶流失。
      3. 第三層是玩家的行爲數據
      4. 第四層是業務常規數據
    3. 離線分析:
      1. 分析哪些數據
        1. 新區註冊人數和時段的關係
          正式開區前通過預約的方式進行註冊,在開區當前進去遊戲和時間關係的比例
          開區當天註冊的人數
          開區之後註冊的人數及時間的關係
        2. 用戶在註冊之後,活躍度分析
        3. 用戶遊戲在線時間及時段分析
        4. 區組金錢充值和合區的分析
      2. 分析的過程
        1. 其他開發人員:遊戲的日誌產生消息。
        2. 本人:
        3. 用戶註冊產生的日誌信息(賬號信息(哪種賬號)、註冊時間、)
        4. 每次進入遊戲及退出遊戲產生的日誌信息(賬號信息、進入時間、退出時間、地點、分配的上線區組、登陸的設備)
        5. 遊戲內的日誌。
      3. 分析的結果
        1. 新區註冊人數和日期的關係圖
        2. 活躍度
        3. 遊戲下載渠道分析
        4. 用戶消費比例、消費因素分析及比例
    4. 實時分析:
  4. 責任描述
    1. 參與產品需求分析,技術方案選型,hadoop等開發環境的搭建;
    2. 編寫、測試、優化MR程序對Flume收集上傳到HDFS的數據進行清洗與過濾;
    3. 通過編寫Hive HQL程序從時間、地域、瀏覽器等多個維度對pv,uv,活躍用戶數、新註冊用戶數、二跳率等指標進行多維度分析統計;
    4. 編寫Sqoop命令週期性或採用增量方式將處理好的結果表數據導入到MySQL中。
    5. 在數據中心經理指導下,接收、分析、實現來自需求部門的數據需求;
    6. 與數據中心運維工程師,數據中心架構師協同,進行日常數據問題審計、查證、處理。

詳細說明:

  1. 離線分析系統​​​​​​​
    1. 遊戲玩家
      1 新增玩家
      1.1 新增設備激活:當日新增加的激活設備量。新增玩家賬戶:當日新增加的玩家帳戶數
      1.2 玩家轉化:安裝遊戲的玩家中(即激活設備)有註冊賬戶的玩家比例,1人多次註冊,只記1次有效轉化。例如:共5臺激活設備,其中3臺每人1次註冊,1臺沒有註冊,1臺註冊了3次賬戶,共註冊了6個不同賬戶;註冊轉化率=(3+1)/5=80%,而不是用6次註冊/5臺設備
      1.3 單設備賬戶數量分析(小號分析):您所選時間內激活的設備,到當前爲止的註冊賬號數目分佈情況。通過小號分析能幫助瞭解多少比例的設備會反覆註冊多個賬戶,多少比例至今還未進行註冊,分析刷小號情況
      1.4 玩家賬戶類型:新增玩家帳號的帳戶類型分佈情況。比如遊戲廠商自有賬號、匿名賬號、QQ賬號、新浪微博賬號等等
      1.5 地區:新增玩家帳號的地區分佈情況
      1.6 渠道:新增玩家帳號的渠道分佈情況,每個玩家始終歸入首次設備激活時的渠道。比如ios、安卓。
      1.7 性別:新增玩家帳號的玩家性別情況,根據您的遊戲中傳入的性別確定玩家的性別
      1.8 年齡:新增玩家帳號的年齡分佈情況,根據您傳入的年齡確定玩家的年齡段
    2. 活躍玩家
      2.1 DAU(Daily Active User)日活躍用戶:在當天登錄過遊戲的用戶。有效反映和衡量一款遊戲核心用戶數。
      2.2 WAU(Weekly Active User)周活躍用戶:當日的最近一週(含當日的倒推7日)活躍玩家,將進行過遊戲的玩家按照帳戶進行排重。
      2.3 MAU(Monthly Active User)月活躍用戶:當日的最近一月(含當日的倒退30日)活躍玩家,將進行過遊戲的玩家按照帳戶進行排重。
      2.4 DAU/MAU:可體現玩家的總體粘度,衡量這30天內每日活躍玩家的交叉重合情況。此比例越趨近於1,代表月活躍中有更多玩家多日活躍;比例越趨近0,則代表大量玩家只在一日中活躍。當比例小於0.1時,遊戲的自傳播性將很差。DAU/MAU×30也用於大致衡量玩家平均每月活躍天數。
      2.5 活躍玩家已玩天數:所選時期的活躍玩家的活躍日期減新增日期的日數差(即其已進行遊戲的天數)的分佈情況。
      2.6 活躍玩家等級:所選時期每日活躍玩家的等級分佈情況,由每日數據組成的時期趨勢可觀測等級的總體走勢。
      2.7 活躍玩家地區:所選時期排重活躍玩家的地區分佈情況。
      2.8 活躍玩家渠道:所選時期排重活躍玩家的渠道分佈情況,渠道按照其最初新增時的渠道確定。
      2.9 活躍玩家性別:所選時期排重活躍玩家的性別情況。
      2.10 活躍玩家年齡:所選時期排重活躍玩家的年齡分佈情況。
    3. 玩家留存
      3.1 新增賬戶留存率:某日新增的玩家/設備中,在該日後的第N日中,還有進行遊戲的玩家/設備比例。
      例如:5月3日新增玩家爲100人,這100人中有24人在5月10日這一天內還有玩過遊戲,5月3日的7日留存率=24/100=24%
      3.2 激活設備留存率:某日新增的玩家/設備中,在該日後的第N日中,還有進行遊戲的玩家/設備比例。
      例如:5月3日新增玩家爲100人,這100人中有24人在5月10日這一天內還有玩過遊戲,5月3日的7日留存率=24/100=24%
      3.3 留存用戶分析:
      用戶羣:次日留存用戶,7日留存用戶,30日留存用戶
      分析方式:新增日的等級,新增日的遊戲次數,新增日的遊戲時長,新增日是否付費,玩家性別,玩家年齡。
  2. 實時在線分析系統
    1. ​​​​​​​付費轉化
      4.1 新增付費玩家:當日新增加的充值玩家。
      4.2 累計付費玩家:截至當日,累計的充過值的玩家數。
      4.3 總體付費率:截至當日,累計付費玩家佔累計總玩家的比例(累計付費玩家/累計玩家帳戶)。
      4.4 新玩家-首日付費率:所選時期的新增玩家中,在新增當日即進行充值的玩家數和其佔比。
      4.5 新玩家-首周付費率:某自然週中進行付費的玩家(排重)佔該自然周活躍玩家的比例。
      4.6 新玩家-首月付費率:某自然月中進行付費的玩家(排重)佔該自然月活躍玩家的比例。
      4.7 新玩家首付的遊戲天數:所選時期內的新增付費玩家,按照其已經玩遊戲的天數(首付日期-新增日期)進行分佈。
      4.8 新玩家首付的累積遊戲時長:所選時期內,玩家首次付費時在遊戲中累計的遊戲時長分佈情況。
      4.9 玩家首付等級:所選時期內,玩家首次付費時的等級分佈情況。
      4.10 玩家首付金額:玩家在遊戲中首次充值時,支付的單比金額的分佈情況。
      4.11 首付充值包類型:玩家在遊戲中首次充值時,所選擇的充值包的類型分佈情況​​​​​​​
    2. 國內第三方數據服務提供商DataEye發佈《手遊玩家秋冬節假日行爲分析報告》。報告顯示:節假日對於手遊玩家活躍有明顯的促進作用,新增用戶也有所增加;手遊玩家在中秋、國慶、元旦、春節這些有假期的節日中,爲獲得節日獎勵,將更多的精力投入到遊戲中,因此其每日累計遊戲時長也有所增加。
  3. 玩家遊戲時長分佈均勻
    115921294
  4. 絕大部分用戶通過分發渠道推薦下載手遊
    115921301
  5. 花錢玩手遊的人更多
    115921302
  6. 多數人消費預算不會變化
    115921307
  7. 爲升級裝備而付費的人居多
    115921333
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章