游戏报表方案设计

原創

2020-06-29 18:40

一.三种方案

方案1. spark streaming 做实时数据分析，hive 做数据仓库，spark sql 做离线数据分析

方案2. spark streaming 做数据同步，es做数据仓库， spark sql 做离线数据分析

方案3：spark streaming 做数据同步，doris 做实时数据分析， spark sql 做离线数据分析

二. 方案优缺点对比

	方案一	方案二	方案三
时效性	分钟级别	小时级别	分钟级别
数据恢复难度	困难（单独写程序恢复）	简单（重跑数据）	简单（重跑数据）
源数据更新	不支持	支持	支持
明细数据查询	不支持	支持	支持
明细和汇总对比	没有明细	存在时差	doris 自带原子性
java 接入复杂度	简单，直接查mysql	复杂，需要java熟悉es	简单，兼容mysql
不同维度数据对比	需要开发者自己对比	需要开发者自己对比	物化视图：只需要存储最小维度数据，其他维度数据自动计算，且保持原子性
内存消耗	小	中	大：完全依赖内存计算，可以通过数据切片减小内存消耗，复杂计算使用 spark

三.方案三，具体说明

数据同步 flume 自定义source开发，可以接入不同数据源，日志，mysql ,mongo,es
doris 四层数据结构解释：

原始数据：保存从数据园过来的最原始的数据
ETL层：使用数据切片，每10分钟从数据原始层切片一次到etl层
数据模型层：根据不同业务需求建立数据模型（主要是不同的物化视图）
大宽表：数据模型层的数据汇总到大宽表，前端查询统一查询大宽表，防止数据对不上

spark 离线分析：由于doris完全使用内存计算，只能使用于简单的实时数据计算；当数据巨大，计算很复杂的时候，只能提供离线数据报表，使用spark 读取 doris 数据，并写入Doris的方案

参考资料：

doris官网： http://doris.apache.org/master/zh-CN/getting-started/basic-usage.html

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AG6320规格书|AG6320中文设计方案|DP转HDMI方案设计

AG6320規格書,AG6320中文設計方案,DP轉HDMI方案,AG6320電路設計 AG6320是一款實現DP TO HDMI/VGA的單片機解決方案。AG6320是一種通過單個顯示端口連接器傳輸視頻和音頻的單片機解決方案。 AG

2020-06-30 18:09:28

AG9300:安格TypeC To VGA单芯片中文设计方案

ALGOLTEK AG9300是一款實現USB TypeC To VGA數據轉換器的單片機解決方案。支持USB Type-C顯示端口交替模式，AG9300可以將視頻和音頻從USB Type-C接口傳輸到VGA端口。 AG9300功能特性

2020-06-30 18:09:28

并发处理

場景：頁面數卡數量(比如：2000)、卡前綴、備註等等。後臺通過前綴和數量，通過隨機數生成一個起卡號和一個結束卡號。然後批量插入數據庫制卡表。（注意：由於卡號生成規則必須是“公司前綴”+公司流水號(每個公司都是從0001開始)+“公司後

2020-06-26 07:15:08

商品中心 --- 淘宝类目属性体系

轉載：淺談淘寶類目屬性體系：商品搜索背後的邏輯架構商品分類體系的演變商品數量很少，沒有分類；商品數量過百，開始使用一級類目；商品數量成千上萬，開始使用多級類目，即類目樹；商品數量達到百萬級，甚至億級別，開始使用“類目+

2020-06-24 23:21:56

用户中心 --- 存储方案

需求分析用戶側用戶側對用戶中心的查詢特點是：查詢頻次高，基本上都是單條查詢，對數據的實時性和一致性要求高，99%的請求爲uid查詢用戶信息，1%的請求爲根據用戶名/郵箱/手機號等條件查詢用戶信息；運營側運營側對用戶

2020-06-24 23:21:56

订单系统设计 --- 系统优化

訂單查詢實時性要求高的查詢走DB；複雜查詢或非實時查詢走ES；避免深分頁查詢，即limit m,n中的m不要過大；參考：基於大中臺架構的電商業務中臺最佳實踐之三：交易中臺技術要點設計之高性能微信紅包訂單存儲架構變

2020-06-24 23:21:56

订单系统设计 --- 交易快照

含義買賣雙方在成交時記錄當時交易狀況的一張“照片”，即交易快照爲一份靜態數據，記錄了交易時的數據，特別是容易變化的數據，比如商品信息，以及優惠信息等；作用作爲發生交易爭執時的判斷依據；範圍訂單信息中已經包含

2020-06-24 23:21:56

订单系统设计 --- SaaS订单中心存储方案

SaaS訂單中心作用爲垂直領域的商家提供訂單管理能力，管理線上（各種互聯網平臺渠道）、線下等不同渠道的訂單；需求分析只是爲商家端提供訂單管理能力，其特點是訪問頻次低，查詢數據量大，需要支持靈活的訂單查詢，能夠容忍一

2020-06-24 23:21:45

windows开发 + linux编译调试环境搭建

windows開發 + linux編譯環境搭建應用場景基於嵌入系統或者linux做開發的時，往往沒有比較成熟的ide，大多數公司開發環境還是在windows下，修改代碼後需要重新編譯，這個過程中需要從windows拷貝修改代碼到lin

2020-06-23 13:29:47

AC——c++数据序列化方案

1 背景 AC(Auto Converter)是一款輕量級的基於c++開發的數據序列化開發框架。框架基於純c++開發，開箱即用，無三方依賴庫。由於c/c++語言沒有類似java\python等到高級語言獲取對象的metadata的功能,

2020-06-23 13:29:47

方案设计--扫码登陆

掃碼登陸實現方案參考： https://mp.weixin.qq.com/s/i5Zp6nd0beCOHPEZUpmMNg 彈屏

2020-06-21 12:37:48

HDMI2.0 3:1转换器方案AG7210/AG7111

HDMI2.0 3:1 Switch轉換器方案，HDMI轉接器設計方案，AG7111/AG7210性能參數對比，AG7210規格書,AG7210中文資料,AG7111規格書，AG7111中文資料,DEMO測試版 AG7210詳細描述：

2020-06-13 13:43:20

快递质量监控实时统计方案设计

目錄數據流程圖和關係數據流程圖數據流程關係需求描述框架和版本方案一說明問題方案二說明數據同步問題 es 查詢問題方案三說明 es 查詢問題方案四（選擇方案）說明 es 查詢問題數據流程圖

2020-06-12 21:35:03

快递行业实时报表方案

一.需求 1.需求描述統計每天，每個網點的快遞單數（有修改，攬收狀態，簽收狀態，是否退件等）表： waybill 字段: 時間：input_time，網點 network ,訂單唯一ID : waybillId 2. 需求sq

2020-06-12 21:34:53

AG7231规格书|AG7231说明书|HDMI2.0KVM方案|AG7231方案应用

AG7231規格書,AG7231中文設計方案,AG7231說明書，AG7231方案應用，HDMI2.0KVM方案 AG7231是一個獨立的解決方案，可以作爲HDMI2.0 2:1kvm（鍵盤-視頻-鼠標）開關控制器運行。它可以在兩個HDM

2020-06-09 15:07:55

24小時熱門文章

最新文章

最新評論文章