原创 九大數據分析方法:指標拆解法

今天繼續跟大家分享:九大數據分析方法系列。之前已經分享過: 週期性分析法 結構分析法 矩陣分析法 這三種方法,都是隻對一、兩個指標進行分析。小夥伴們肯定會問:那如果有好幾個指標,要怎麼進行分析呢?答:當遇到好幾個指標的時候,得先分清這些指標

原创 數據驅動決策的三個層級

很多同學總好奇:“數據分析要怎麼做,才能驅動決策?”天天總聽人說:數據驅動,可現實中沒見過,只見過自己寫的報告石沉大海…… 今天結合一個具體案例講解一下,到底如何做。話不多說,直接上場景。 問題場景:某二手交易平臺,其中舊貨回收環節,需要人

原创 數據質量理論與經驗

本文轉載自微信公衆號「數倉與大數據」,作者otw30 。轉載本文請聯繫數倉與大數據公衆號。 數據質量管理是對數據從計劃、收集、記錄、存儲、回收、分析和展示生命週期的每個階段裏可能引發的數據質量問題,進行識別、度量、監控、預警等一系列管理活動

原创 數據分析矩陣分析法

本文轉載自微信公衆號「碼工小熊」,作者小熊妹。轉載本文請聯繫碼工小熊公衆號。 大家好,我是愛學習的小xiong熊妹。 今天繼續分享九大數據分析方法系列:矩陣分析法。矩陣分析法是在各路數據分析文章中,出現頻率最高的詞。甚至有不懂行的小白把它捧

原创 數據資產管理

數據資產管理介紹 1.定義 在明白數據資產管理之前,要明白管理的數據資產是什麼? “數據資產”定義爲:“由企業擁有或控制的,能夠爲企業帶來未來經濟利益的,以物理或者電子的方式記錄的數據資源,如文件資料、電子數據等。” 從上面的數據資產定義

原创 數據中臺_張家峯

https://hf200012.github.io/#blog

原创 Hudi的更新機制

在深入研究Hudi機制之前,讓我們首先了解Hudi正在解決的問題。 客戶在使用數據湖時通常會問一個問題:當源記錄被更新時,如何更新數據湖?這是一個很難解決的問題,因爲一旦你寫了CSV或Parquet文件,唯一的選擇就是重寫它們,沒有一種簡單

原创 寬表的設計

寬表的設計 爲什麼要建設寬表 寬表的好處和不足 如何設計寬表 總結 寬表的設計 其實寬表是數倉裏面非常重要的一塊,前面我們介紹過了維度表事實表,今天我們介紹一下寬表,前面我們說過了數倉是分層的,這是技術進步和時代

原创 數倉指標體系

目錄 指標體系 指標建設過程中遇到的問題 指標建設方法論 北極星指標 人貨場指標體系 OSM+UJM 模型 OSM+ AARRR海盜模型 指標分級方法 指標的構成 指標分類 簡單計數型指標 複合型指標 基礎指標 衍生指標

原创 OPPO 數據平臺降本增效實踐

https://www.infoq.cn/article/q5zMimjLWjG1Vk1qgVUg?utm_source=related_read&utm_medium=article

原创 多雲趨勢

https://www.infoq.cn/article/z8MQxvAwASPJjfITkpcE

原创 數果實時數倉探索

  Vol.1 實時數倉的發展   在早期也有部分公司有實時計算的需求,但是數據量比較少,所以在實時方面無法形成完整的體系,實時數倉更多是以實時計算的形式存在,作爲離線數倉的輔助,主要使用的技術也是Storm或Spark Streaming

原创 數據平臺上雲

“戒備”與“偏見” 幾年前,我所在的一家傳統行業的頭部企業啓動了一系列數字化轉型項目,在配套的 IT 基礎設施建設上,“上雲”已是大勢所趨。 在此前數年的工作中,我斷斷續續地使用着公有云產品,大多數情況下,我們只選擇 IaaS 層級的服務,

原创 基於 Flink CDC + Hudi 湖倉一體方案實踐

一、Flink-CDC 2.0 Flink CDC Connectors 是 Apache Flink 的一個 source 端的連接器,目前 2.0 版本支持從 MySQL 以及 Postgres 兩種數據源中獲取數據,2.1 版本社區確

原创 Hudi on Flink上手使用總結

https://blog.csdn.net/penriver/article/details/120563186?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.non