redis使用场景之HyperLogLog---应用于独立信息统计

原創

2020-06-09 10:37

如果我们统计不重复数据的数量，比如统计独立UV，我们会有如下方案：

原始方案：set

存储每个用户的id（字符串）

改进方案：bitmaps

存储每个用户状态（bit）

全新的方案：HyperLogLog

基数

首先我们来认识一下基数

{1,3,5,7,5,7,8} 基数集{1,3,5,7,8} 基数：5

Hyperloglog类型的基本操作

添加数据

pfadd key element [element...]

统计数据

pfcount key [key...]

合并数据

pfmerge destkey sourcekey [sourcekey...]

操作如下：

h11为key，随便起，001,002代表用户id，或者可以放ip地址、人名等都可以

相关说明

用于进行基数统计，不是集合，不保存数据，只记录数量而不是具体数据
核心是基数估算算法，最终数值存在一定误差
误差范围：基数估计得结果是一个带有0.81%标准错误的近似值
耗空间极小，每个hyperloglog key占用了12k的内存用于标记基数
pfadd命令不是一次性分配12k内存使用，会随着基数的增加内存逐渐增大
pfmerge命令合并后占用的存储空间为12k，无论合并之前数据是多少

一般使用场景

统计注册 IP 数
统计每日访问 IP 数
统计页面实时 UV 数
统计在线用户数
统计用户每天搜索不同词条的个数

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

使用 Spring Cloud Alibaba AI 构建 RAG 应用

作者：姬世文背景介紹 RAG（Retrieval Augmented Generation）檢索增強生成（RAG）是一種用於將數據與人工智能模型集成的技術。在 RAG 工作流程中，第一步將文檔數據加載到矢量數據庫（例如 Redis）中。

2024-05-27 21:13:51

GeminiDB PITR，让游戏回档“进退自如”！

本文分享自華爲雲社區《GeminiDB PITR，讓遊戲回檔“進退自如”！》，作者：GaussDB 數據庫。在實際業務場景中，客戶數據庫難免會出現數據損毀、數據丟失、數據誤刪除等故障場景。爲保障業務的正常運行，通常需要將數據庫恢復到故障發

2024-05-24 10:58:17

在Java中，如何以编程的方式设置 Excel 单元格样式

前言在Java開發中，處理Excel文件是一項常見的任務。在處理Excel文件時，經常需要對單元格進行樣式設置，以滿足特定的需求和美化要求，通過使用Java中的相關庫和API，我們可以輕鬆地操作Excel文件並設置單元格的樣式。在本文中

2024-05-20 10:46:43

在Java中，如何以编程的方式设置 Excel 单元格样式

前言在Java開發中，處理Excel文件是一項常見的任務。在處理Excel文件時，經常需要對單元格進行樣式設置，以滿足特定的需求和美化要求，通過使用Java中的相關庫和API，我們可以輕鬆地操作Excel文件並設置單元格的樣式。在本文中

2024-05-20 10:46:42

win 环境下 docker 的使用整理

1、下載： https://www.docker.com/products/docker-desktop/ 如果電腦分多個盤，建議下載到可用存儲較大的盤，安裝的時候默認安裝到 C 盤，安裝完成後雙擊啓動如果出現【Docker

2024-05-17 00:25:04

Spring cloud gateway入门

微服務Gateway 微服務網關部署在前端Nginx網關和後端微服務之間，Nginx一般充當流量網關，而微服務網關屬於一種業務型網關，微服務網關層爲後端的微服務羣組提供統一的接入地址，其核心功能是統一做服務路由，在路由基礎上還可以實現一

2024-05-15 11:50:15

播放全链路压测实践之路

01 背景播放鏈路是愛奇藝最重要的業務，鏈路穩定性極其重要，隨着愛奇藝用戶的不斷增長和熱播劇集的推廣，播放鏈路往往面臨着難以預估的用戶流量的突增，考

愛奇藝技術產品團隊

2024-05-14 02:28:30

redis未授权访问漏洞修复方案

1.redis未授權訪問漏洞通過redis未授權訪問漏洞，會造成敏感信息泄露，甚至被利用直接控制服務器，其危害不言而喻。但是在實際工作中，發現一些開發人員和運維人員並不知道如何妥善配置。因此有了本文，對redis的配置，建議就是2條，一

2024-05-14 02:04:38

我拍了拍Redis，被移出了群聊···

01 Redis的新煩惱你好，我是Redis，一個叫Antirez的男人把我帶到了這個世界上。自從上次被拉入羣聊之後，我就從一個人單打獨鬥變成了團隊合作，在小夥伴們的共同努力下，不僅有主從複製可以數據備份，還有哨兵節點負責監控管理

2024-05-14 01:06:44

redis-benchmark并发压力测试

前言： Redis-benchmark： Redis 自帶了一個叫 redis-benchmark 的工具來模擬 N 個客戶端同時發出 M 個請求。（類似於 Apache ab 程序）。你可以使用 redis-benchmark -h

2024-05-14 00:37:31

Windows Redis 开机启动后台运行

1. 從 Redis 的安裝目錄進入 cmd 2. 在 cmd 中輸入, 將Redis綁定爲 Windows 服務, 並設置爲後臺啓動： redis-server --service-install redis.windows.con

2024-05-13 23:37:31

记一次特别的未授权访问

某個夜裏，隨手點進去的一個小程序，引發的連鎖反應。開局一個小程序：登錄方式令人發愁，嘗試收集，無果。數據交互的地方說不定有sql，再次嘗試，還是無果。複製連接去web端，看看有沒有什麼收穫：好熟悉的界面，這不是SpringB

2024-05-13 23:18:59

cheerp 编译器之通用计算模块ccm1

cheerp 通用計算模塊(ccm1) 是基於cheerp 編譯器發射出平臺格式無關的wasm中間代碼，在不同宿主之內運行的一種模塊化方式。 0x1. 不同宿主的相同代碼實現 ccm1 的一般宿主是c++實現，不同平臺編譯引用就可以，目

2024-05-12 21:53:46

Java程序员5面阿里终获offer，感慨：原来阿里面试这么严

坊間傳言的阿里P6招聘需求感覺面試還是主要圍繞簡歷來問的，所以不熟悉的東西最好不要隨便寫上去。項目和基礎都很重要，項目中最好有難點，能夠體現自己解決問題的過程和思路。電話面：自我介紹事務的特性 ACID ，

2024-05-11 14:54:29

一招MAX降低10倍，现在它是我的了| 京东零售技术团队

一.背景性能優化是一場永無止境的旅程。到家門店系統，作爲到家核心基礎服務之一，門店C端接口有着調用量高，性能要求高的特點。 C端服務經過演進，核心接口先查詢本地緩存，如果本地緩存沒有命中，再查詢Redis。本地緩存命中率99%，服務性能

2024-05-10 12:41:31

24小時熱門文章

最新文章

最新評論文章