電商用戶行爲分析大數據平臺相關係列10-基礎數據結構分析

數據結構分析主要是分析數據庫表結構,其中包括Hive表以及Mysql表。課程實戰中主要用了以下數據表:
- user_visit_action(Hive表):用戶訪問行爲表
- user_info(Hive表):用戶基本信息表
- task(Mysql表):用戶提交任務記錄表。

1、表結構詳細說明:

1.1、user_visit_action

user_visit_action表,其實就是放網站或者是app,每天的點擊流的數據。可以理解爲,用戶對網站/app每點擊一下,就會代表在這個表裏面的一條數據。

user_visit_action
    date:日期,代表用戶點擊行爲是哪一天發生的。
    user_id:代表點擊用戶。
    session_id:標識用戶session。
    page_id:點擊某些商品/品類,或者搜索了某個關鍵詞,然後進入某個頁面,頁面id。
    action_time:點擊行爲的發生時間點
    search_keyword:搜索關鍵詞
    click_category_id:點擊品類id
    click_product_id:點擊商品id
    order_product_ids:訂單中包含商品
    order_category_ids:訂單中包含品類id。
    pay_category_ids:某次支付對應品類id。
    pay_product_ids:某次支付,對應商品id

1.2、user_info

ser_info表,實際上就是一張最普通的用戶基礎信息表;這張表裏面,其實就是放置了網站/app所有的註冊用戶的信息。這裏也是對用戶信息表進行了一定程度的簡化。比如略去了手機號等這種數據。因爲項目裏不需要使用到某些數據。那麼我們就保留一些最重要的數據即可。

user_info
    user_id:每一個用戶的唯一標識,通常是自增長Long類型,BigInt類型。
    username:登錄名
    name:暱稱或者真實名稱
    age:年齡
    professional:用戶的職業
    city:用戶所在城市

1.3、task

task表,其實是用來保存平臺的使用者通過J2EE系統提交的基於特定篩選參數的分析任務,的信息,就會通過J2EE系統保存到task表中來。之所以使用MySQL表,是因爲J2EE系統是要實現快速的實時插入和查詢的。

task
    task_id:表的主鍵
    task_name:任務名稱
    create_time:創建時間
    start_time:開始運行時間
    finish_time:結束運行時間
    task_type:任務類型。在一套大數據平臺中,肯定會有各種不同類型的統計分析任務,比如說用戶訪問session分析任務,頁面單跳轉化率統計任務;所以這個字段就標識了每個任務的類型
    task_status:任務狀態,新建、待運行、運行中,已結束,
    task_param:任務參數,使用json保存用戶提交任務時對應特殊參數。

電商用戶行爲分析大數據平臺系列已發佈筆記列表

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章