redis使用場景之HyperLogLog---應用於獨立信息統計

原創

2020-06-09 10:37

如果我們統計不重複數據的數量，比如統計獨立UV，我們會有如下方案：

原始方案：set

存儲每個用戶的id（字符串）

改進方案：bitmaps

存儲每個用戶狀態（bit）

全新的方案：HyperLogLog

基數

首先我們來認識一下基數

{1,3,5,7,5,7,8} 基數集{1,3,5,7,8} 基數：5

Hyperloglog類型的基本操作

添加數據

pfadd key element [element...]

統計數據

pfcount key [key...]

合併數據

pfmerge destkey sourcekey [sourcekey...]

操作如下：

h11爲key，隨便起，001,002代表用戶id，或者可以放ip地址、人名等都可以

相關說明

用於進行基數統計，不是集合，不保存數據，只記錄數量而不是具體數據
核心是基數估算算法，最終數值存在一定誤差
誤差範圍：基數估計得結果是一個帶有0.81%標準錯誤的近似值
耗空間極小，每個hyperloglog key佔用了12k的內存用於標記基數
pfadd命令不是一次性分配12k內存使用，會隨着基數的增加內存逐漸增大
pfmerge命令合併後佔用的存儲空間爲12k，無論合併之前數據是多少

一般使用場景

統計註冊 IP 數
統計每日訪問 IP 數
統計頁面實時 UV 數
統計在線用戶數
統計用戶每天搜索不同詞條的個數

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Spring cloud gateway入門

微服務Gateway 微服務網關部署在前端Nginx網關和後端微服務之間，Nginx一般充當流量網關，而微服務網關屬於一種業務型網關，微服務網關層爲後端的微服務羣組提供統一的接入地址，其核心功能是統一做服務路由，在路由基礎上還可以實現一

2024-05-15 11:50:15

播放全鏈路壓測實踐之路

01 背景播放鏈路是愛奇藝最重要的業務，鏈路穩定性極其重要，隨着愛奇藝用戶的不斷增長和熱播劇集的推廣，播放鏈路往往面臨着難以預估的用戶流量的突增，考

愛奇藝技術產品團隊

2024-05-14 02:28:30

redis未授權訪問漏洞修復方案

1.redis未授權訪問漏洞通過redis未授權訪問漏洞，會造成敏感信息泄露，甚至被利用直接控制服務器，其危害不言而喻。但是在實際工作中，發現一些開發人員和運維人員並不知道如何妥善配置。因此有了本文，對redis的配置，建議就是2條，一

2024-05-14 02:04:38

我拍了拍Redis，被移出了羣聊···

01 Redis的新煩惱你好，我是Redis，一個叫Antirez的男人把我帶到了這個世界上。自從上次被拉入羣聊之後，我就從一個人單打獨鬥變成了團隊合作，在小夥伴們的共同努力下，不僅有主從複製可以數據備份，還有哨兵節點負責監控管理

2024-05-14 01:06:44

redis-benchmark併發壓力測試

前言： Redis-benchmark： Redis 自帶了一個叫 redis-benchmark 的工具來模擬 N 個客戶端同時發出 M 個請求。（類似於 Apache ab 程序）。你可以使用 redis-benchmark -h

2024-05-14 00:37:31

Windows Redis 開機啓動後臺運行

1. 從 Redis 的安裝目錄進入 cmd 2. 在 cmd 中輸入, 將Redis綁定爲 Windows 服務, 並設置爲後臺啓動： redis-server --service-install redis.windows.con

2024-05-13 23:37:31

記一次特別的未授權訪問

某個夜裏，隨手點進去的一個小程序，引發的連鎖反應。開局一個小程序：登錄方式令人發愁，嘗試收集，無果。數據交互的地方說不定有sql，再次嘗試，還是無果。複製連接去web端，看看有沒有什麼收穫：好熟悉的界面，這不是SpringB

2024-05-13 23:18:59

cheerp 編譯器之通用計算模塊ccm1

cheerp 通用計算模塊(ccm1) 是基於cheerp 編譯器發射出平臺格式無關的wasm中間代碼，在不同宿主之內運行的一種模塊化方式。 0x1. 不同宿主的相同代碼實現 ccm1 的一般宿主是c++實現，不同平臺編譯引用就可以，目

2024-05-12 21:53:46

Java程序員5面阿里終獲offer，感慨：原來阿里面試這麼嚴

坊間傳言的阿里P6招聘需求感覺面試還是主要圍繞簡歷來問的，所以不熟悉的東西最好不要隨便寫上去。項目和基礎都很重要，項目中最好有難點，能夠體現自己解決問題的過程和思路。電話面：自我介紹事務的特性 ACID ，

2024-05-11 14:54:29

一招MAX降低10倍，現在它是我的了| 京東零售技術團隊

一.背景性能優化是一場永無止境的旅程。到家門店系統，作爲到家核心基礎服務之一，門店C端接口有着調用量高，性能要求高的特點。 C端服務經過演進，核心接口先查詢本地緩存，如果本地緩存沒有命中，再查詢Redis。本地緩存命中率99%，服務性能

2024-05-10 12:41:31

深入理解分佈式鎖：原理、應用與挑戰| 京東物流技術團隊

前言在單機環境中，我們主要通過線程間的加鎖機制來確保同一時間只有一個線程能夠訪問某個共享資源或執行某個關鍵代碼塊，從而防止各種併發修改異常。例如，在Java中提供了synchronized/Lock。但是在分佈式環境中，這種線程間的鎖機制

2024-05-10 00:30:02

營銷權益平臺春晚技術探究| 京東雲技術團隊

一、引言在當前快速發展的互聯網環境中，許多企業和服務都面臨着高併發場景的挑戰。隨着用戶規模不斷增長，對於同一時間內大量用戶請求的處理能力、系統性能、穩定性和容錯性的要求也日益提高。高併發場景對系統架構設計、數據庫設計、緩存策略、自動化運

2024-05-07 23:17:14

CCE雲原生混部場景下的測試案例

本文分享自華爲雲社區《CCE雲原生混部場景下在線任務搶佔、壓制離線任務CPU資源、保障在線任務服務質量效果測試》，作者：可以交個朋友。背景企業的 IT 環境通常運行兩大類進程，一類是在線服務，一類是離線作業。在線任務：運行時間長，服

2024-05-07 10:33:03

Centos7 使用 Docker 安裝 owncloud

centos7 安裝 docker 安裝教程可參考：centos7 安裝 docker 開始安裝owncloud 1. 創建一個新的項目目錄 mkdir owncloud-docker-server cd owncloud-doc

2024-05-06 23:24:42

Redis開源社區持續壯大，華爲云爲Valkey項目注入新的活力

摘要：作爲Valkey社區的Technical Steering Committee member，華爲雲將持續參與社區建設。一、背景今年3月21日，Redis Labs宣佈從Redis 7.4版本開始，將原先比較寬鬆的BSD

2024-05-06 22:32:57

24小時熱門文章

最新文章

最新評論文章