業務背景
衆所周知,廣告是很多互聯網公司的主要收入,對於字節跳動來說也是如此。那麼,在字節跳動廣告的 DMP&CDP 業務,乃至所有廣告業務中,有哪些場景在使用 ClickHouse 呢?是在線服務還是離線統計的呢?應該說都有。
可以從三個場景來講:人羣預估、人羣畫像和統計分析。
人羣預估 主要是根據一定的圈選條件,確認命中的用戶數目。在廣告精準投放過程中,廣告主需要知道當前選定的人羣組合中大概會有多少人,用於輔助判斷投放情況進而確定投放預算。因爲是在線業務,一般要求計算的時間不能超過 5 秒。
人羣畫像 主要是對廣告投放的用戶羣進行畫像分析,也是在線的,同樣對時間有一定的要求,因爲是偏分析的場景,一般不能超過 20 秒,否則用戶的體驗就非常差了。
統計分析 的使用場景比較多,在線、離線都有,包括一些搜索詞統計分析,廣告、投放收入數據的分析等等,應用的方面很多。
我今天主要分享的是人羣預估,因爲這是一個比較大的難點。而對於統計分析來說本身就是 ClickHouse 的強項。
就如我之前說的,人羣預估就是根據一定的圈選條件,確認命中的用戶數目。比如下圖中我們可以看到,在投放廣告的時候,可以根據地域、性別、年齡、興趣、首次激活時間等條件進行圈選。其本質就是集合的快速交併補計算。
原文鏈接:【https://www.infoq.cn/article/lrVSgWF9WZNzLkLF8rop】。未經作者許可,禁止轉載。