《大型綜合項目-基於大數據平臺的數據倉庫》學習筆記之(02):數據介紹篇

本項目教程筆記源自多易教育《Titan綜合數據倉庫與數據運營系統》,在CSDN學院有相關視頻教程購買鏈接,大數據企業級項目實戰–Titan大型數據運營系統
本項目課程是一門極具綜合性和完整性的大型大數據項目實戰課程,課程項目的業務背景源自各類互聯網公司對海量用戶瀏覽行爲數據和業務數據分析的需求及企業數據管理、數據運營需求。
學完本課程,你將很容易就拿到大數據數倉建設或用戶畫像建設等崗位的OFFER

本課程項目涵蓋數據採集與預處理數據倉庫體系建設、用戶畫像系統建設、數據治理(元數據管理、數據質量管理)、任務調度系統、數據服務層建設、OLAP即席分析系統建設等大量模塊,力求原汁原味重現一個完備的企業級大型數據運營系統。

跟隨項目課程,歷經接近100+小時的時間,從需求分析開始,到數據埋點採集,到預處理程序代碼編寫,到數倉體系搭建…逐漸展開整個項目的宏大視圖,構建起整個項目的摩天大廈。


一、App/Web埋點日誌

分爲前端(html頁面/H5頁面/app/微信小程序)埋點和後端埋點
埋點就是植入一些用於蒐集用戶行爲信息的代碼!

通過在app上用sdk埋點,或者在網頁上用js埋點,監聽用戶的操作,生成相應的事件描述發送到日誌服務器;

網頁上嵌入jd-sdk的代碼示例:
<a href="#" onclick="_czc.push(['_trackEvent', '小說', '打分', '達芬奇密碼','5','dafen']);">打分</a>
1、整體架構

其中主要包含如下信息:

  • 時間信息
  • 地域信息
  • 用戶屬性
  • 終端設備屬性
  • 事件信息

其中主體結構爲一個json字串,樣例如下:
在這裏插入圖片描述

2、事件類型說明

       關於事件類型和event字段舉例說明如下:
       更詳細內容請參見:《易頭條-事件設計模板》

編號 事件名稱 說明
1 startup 啓動事件
2 favor 收藏事件
3 rate 評分事件
4 add_cart 添加item到購物車事件
5 thumbup 點贊事件
6 ad_click 點擊廣告事件
7 ad_show 廣告展示曝光事件
8 search 站內搜索事件
9 pg_view 頁面瀏覽事件
10 rec_click 推薦項點擊事件 “推薦欄目id,商品id,事件所發生的頁面”
11 sub_order 提交訂單事件

在這裏插入圖片描述
事件字段舉例說明:

pg_view事件
"event":{  
"pgid":"30-03-258413"  // 所瀏覽的頁面的id
          "url":"/abc/edh/30-03-258413.html?a=x&b=y",
          "title":"Xiaomi/小米 小米8SE 前置2000萬柔光自拍 超感光雙攝",
          "skuid":"3985910262736",  // 商品id
          "trace_id":"uuid092304ksdl0wei",  // 廣告跟蹤碼
   }

ad_show 事件
"event":{  
"adid":"10-03-01"  // ad_id
        "url":"/abc/edh/a.html?a=x&b=y",
        "skuid":"3985910262736",  // 商品id
   }

ad_click 事件
"event":{  
"adid":"10-03-01"  // ad_id
        "url":"/abc/edh/a.html?a=x&b=y",
        "trace_id":"uuid092304ksdl0wei",  // 廣告跟蹤碼
        "skuid":"3985910262736",  // 商品id
   }

注意: 不同事件日誌的event字段,屬性的個數和含義均有不同!
詳情請參考實際日誌數據文件!

3、字段類型說明

       longtitude: 爲Double
       latitude: 爲Double
       其他字段原始類型皆爲String

4、UTM廣告跟蹤特別說明

       UTM是在站外(如google廣告聯盟)投放廣告後,用於統計分析廣告效果的一種技術手段。它通過在廣告的目標地址後面添加一系列“廣告屬性標識”來對廣告流量進行識別;

二、業務數據

在這裏插入圖片描述
在這裏插入圖片描述


本項目教程筆記源自多易教育《Titan綜合數據倉庫與數據運營系統》,在CSDN學院有相關視頻教程購買鏈接,大數據企業級項目實戰–Titan大型數據運營系統
本項目課程是一門極具綜合性和完整性的大型大數據項目實戰課程,課程項目的業務背景源自各類互聯網公司對海量用戶瀏覽行爲數據和業務數據分析的需求及企業數據管理、數據運營需求。
學完本課程,你將很容易就拿到大數據數倉建設或用戶畫像建設等崗位的OFFER

本課程項目涵蓋數據採集與預處理數據倉庫體系建設、用戶畫像系統建設、數據治理(元數據管理、數據質量管理)、任務調度系統、數據服務層建設、OLAP即席分析系統建設等大量模塊,力求原汁原味重現一個完備的企業級大型數據運營系統。

跟隨項目課程,歷經接近100+小時的時間,從需求分析開始,到數據埋點採集,到預處理程序代碼編寫,到數倉體系搭建…逐漸展開整個項目的宏大視圖,構建起整個項目的摩天大廈。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章