redis集群使用HashMap优化键值存储结构提升存储性能

原創

南熏门前一只喵

2020-06-28 01:22

项目中遇到Spark Streaming吞吐量太低的问题，redis集群使用HashMap优化键值存储结构提升Spark Streaming吞吐量。

场景：
设备将运行报文发送到kafka，Spark Streaming对报文进行加工处理，生成6类不同报文信息以json字符串形式set进redis集群。

问题：
kafka消费速度跟不上。

分析：
对于1000万设备一个上报周期上报1000万条报文，极端情况下同时上报，Spark Streaming消费1000万条报文，生成6000万个键值对存储入redis集群。
优化思路，降低Spark Streaming操作redis的频率，降低key的数量。提升Spark Streaming吞吐量，提升redis集群的查询速度以及后续key的更新速度。计划使用HashMap结构将6类json报文的属性提取出来作为HashMap的field。

测试：
相同集群环境下set操作和hset操作均使用基于Lettuce的Spring data redis客户端。使用pipliene的方式进行命令提交。每批处理命令1000条。
set模式使用3个json报文共32个属性，hset模式使用一个相同32属性的Map。则set模式下存储报文量为hset模式下的3倍。

结果：

	set	hset	速度提升
10万数量级场景	1.3min(30万)	51s(10万)	34%
100万数量级场景	1.3min(300万)	51s(100万)	27%
1000万数量级场景	1.789hours(3000万)	1.295hous(1000万)	27%

结论：
使用HashMap结构降低redsi集群键值数量可以提升存储性能，提升Spark Streaming吞吐量。提升预估20%~30%，待现网验证，补充结果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

营销系统黑名单优化：位图的应用解析

背景營銷系統中，客戶投訴是業務發展的一大阻礙，一般會過濾掉黑名單高風險賬號，並配合頻控策略，來減少客訴，進而增加營銷效率，減少營銷成本，提升營銷質量。營銷系統一般是通過大數據分析建模，在CDP（客戶數據平臺，以客戶爲核心，圍繞數據融

京東雲開發者

2024-06-06 11:54:12

Redis7.2启动程序源码解析

[toc] 簡介 Redis 是一個單線程的數據服務，高性能，速度快，使用C語言實現，它的內部使用了一個 eventLoop 事件循環器來實現客戶端與服務端的通信。下面我們就來分析下Redis7.2的啓動程序源碼。 1、server.c m

2024-06-05 22:52:48

本地缓存Ehcache的应用实践

java本地緩存包含多個框架，其中常用的包括：Caffeine、Guava Cache和Ehcache，其中Caffeine號稱本地緩存之王，也是近年來被衆多程序員推崇的緩存框架，同時也是SpringBoot內置的本地緩存實現。但是除了

京東雲開發者

2024-05-31 23:55:56

使用 Spring Cloud Alibaba AI 构建 RAG 应用

作者：姬世文背景介紹 RAG（Retrieval Augmented Generation）檢索增強生成（RAG）是一種用於將數據與人工智能模型集成的技術。在 RAG 工作流程中，第一步將文檔數據加載到矢量數據庫（例如 Redis）中。

2024-05-27 21:13:51

GeminiDB PITR，让游戏回档“进退自如”！

本文分享自華爲雲社區《GeminiDB PITR，讓遊戲回檔“進退自如”！》，作者：GaussDB 數據庫。在實際業務場景中，客戶數據庫難免會出現數據損毀、數據丟失、數據誤刪除等故障場景。爲保障業務的正常運行，通常需要將數據庫恢復到故障發

2024-05-24 10:58:17

在Java中，如何以编程的方式设置 Excel 单元格样式

前言在Java開發中，處理Excel文件是一項常見的任務。在處理Excel文件時，經常需要對單元格進行樣式設置，以滿足特定的需求和美化要求，通過使用Java中的相關庫和API，我們可以輕鬆地操作Excel文件並設置單元格的樣式。在本文中

2024-05-20 10:46:43

在Java中，如何以编程的方式设置 Excel 单元格样式

前言在Java開發中，處理Excel文件是一項常見的任務。在處理Excel文件時，經常需要對單元格進行樣式設置，以滿足特定的需求和美化要求，通過使用Java中的相關庫和API，我們可以輕鬆地操作Excel文件並設置單元格的樣式。在本文中

2024-05-20 10:46:42

win 环境下 docker 的使用整理

1、下載： https://www.docker.com/products/docker-desktop/ 如果電腦分多個盤，建議下載到可用存儲較大的盤，安裝的時候默認安裝到 C 盤，安裝完成後雙擊啓動如果出現【Docker

2024-05-17 00:25:04

Spring cloud gateway入门

微服務Gateway 微服務網關部署在前端Nginx網關和後端微服務之間，Nginx一般充當流量網關，而微服務網關屬於一種業務型網關，微服務網關層爲後端的微服務羣組提供統一的接入地址，其核心功能是統一做服務路由，在路由基礎上還可以實現一

2024-05-15 11:50:15

播放全链路压测实践之路

01 背景播放鏈路是愛奇藝最重要的業務，鏈路穩定性極其重要，隨着愛奇藝用戶的不斷增長和熱播劇集的推廣，播放鏈路往往面臨着難以預估的用戶流量的突增，考

愛奇藝技術產品團隊

2024-05-14 02:28:30

redis未授权访问漏洞修复方案

1.redis未授權訪問漏洞通過redis未授權訪問漏洞，會造成敏感信息泄露，甚至被利用直接控制服務器，其危害不言而喻。但是在實際工作中，發現一些開發人員和運維人員並不知道如何妥善配置。因此有了本文，對redis的配置，建議就是2條，一

2024-05-14 02:04:38

Spring项目中使用NIO并行调用http接口指南

1-背景後臺BFF層服務爲了SEO，涉及大量對底層數據的聚合，如果按照過程化編程，串行執行請求數據再聚合會造成很高的延遲，因此我們往往大量使用多線程技術並行化多個查詢，來減少單個請求的響應時間。多線程一定程度上也能達成通過並行化提升

2024-05-23 11:10:25

Spring优雅使用log4j2日志

1-前言 Spring框架本身提供了對日誌的集成，對logback的支持非常好，但是對log4j和log4j2的支持就沒那麼好。在同步打印日誌的場景下logback擁有最高的日誌吞吐量《Logback Throughput Benchma

2024-05-22 23:12:10

为什么不推荐在Spring Boot中使用@Value加载配置

@Value註解相信很多Spring Boot的開發者都已經有接觸了，通過使用該註解，我們可以快速的把配置信息加載到Spring的Bean中。比如下面這樣，就可以輕鬆的把配置文件中key爲com.didispace.title配置信息加載

2024-05-21 21:46:20

Spring boot自动装配实现原理

自動裝配原理分析條件註冊機制 spring-context模塊中有兩個組件：Condition接口和@Conditional註解，在@Conditional註解中可以指定一組Condition實現，通常@Conditional是和@Co

2024-05-16 23:48:07

24小時熱門文章

最新文章

最新評論文章