redis集羣使用HashMap優化鍵值存儲結構提升存儲性能

原創

南熏门前一只喵

2020-06-28 01:22

項目中遇到Spark Streaming吞吐量太低的問題，redis集羣使用HashMap優化鍵值存儲結構提升Spark Streaming吞吐量。

場景：
設備將運行報文發送到kafka，Spark Streaming對報文進行加工處理，生成6類不同報文信息以json字符串形式set進redis集羣。

問題：
kafka消費速度跟不上。

分析：
對於1000萬設備一個上報週期上報1000萬條報文，極端情況下同時上報，Spark Streaming消費1000萬條報文，生成6000萬個鍵值對存儲入redis集羣。
優化思路，降低Spark Streaming操作redis的頻率，降低key的數量。提升Spark Streaming吞吐量，提升redis集羣的查詢速度以及後續key的更新速度。計劃使用HashMap結構將6類json報文的屬性提取出來作爲HashMap的field。

測試：
相同集羣環境下set操作和hset操作均使用基於Lettuce的Spring data redis客戶端。使用pipliene的方式進行命令提交。每批處理命令1000條。
set模式使用3個json報文共32個屬性，hset模式使用一個相同32屬性的Map。則set模式下存儲報文量爲hset模式下的3倍。

結果：

	set	hset	速度提升
10萬數量級場景	1.3min(30萬)	51s(10萬)	34%
100萬數量級場景	1.3min(300萬)	51s(100萬)	27%
1000萬數量級場景	1.789hours(3000萬)	1.295hous(1000萬)	27%

結論：
使用HashMap結構降低redsi集羣鍵值數量可以提升存儲性能，提升Spark Streaming吞吐量。提升預估20%~30%，待現網驗證，補充結果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

win 環境下 docker 的使用整理

1、下載： https://www.docker.com/products/docker-desktop/ 如果電腦分多個盤，建議下載到可用存儲較大的盤，安裝的時候默認安裝到 C 盤，安裝完成後雙擊啓動如果出現【Docker

2024-05-17 00:25:04

Spring cloud gateway入門

微服務Gateway 微服務網關部署在前端Nginx網關和後端微服務之間，Nginx一般充當流量網關，而微服務網關屬於一種業務型網關，微服務網關層爲後端的微服務羣組提供統一的接入地址，其核心功能是統一做服務路由，在路由基礎上還可以實現一

2024-05-15 11:50:15

播放全鏈路壓測實踐之路

01 背景播放鏈路是愛奇藝最重要的業務，鏈路穩定性極其重要，隨着愛奇藝用戶的不斷增長和熱播劇集的推廣，播放鏈路往往面臨着難以預估的用戶流量的突增，考

愛奇藝技術產品團隊

2024-05-14 02:28:30

redis未授權訪問漏洞修復方案

1.redis未授權訪問漏洞通過redis未授權訪問漏洞，會造成敏感信息泄露，甚至被利用直接控制服務器，其危害不言而喻。但是在實際工作中，發現一些開發人員和運維人員並不知道如何妥善配置。因此有了本文，對redis的配置，建議就是2條，一

2024-05-14 02:04:38

我拍了拍Redis，被移出了羣聊···

01 Redis的新煩惱你好，我是Redis，一個叫Antirez的男人把我帶到了這個世界上。自從上次被拉入羣聊之後，我就從一個人單打獨鬥變成了團隊合作，在小夥伴們的共同努力下，不僅有主從複製可以數據備份，還有哨兵節點負責監控管理

2024-05-14 01:06:44

redis-benchmark併發壓力測試

前言： Redis-benchmark： Redis 自帶了一個叫 redis-benchmark 的工具來模擬 N 個客戶端同時發出 M 個請求。（類似於 Apache ab 程序）。你可以使用 redis-benchmark -h

2024-05-14 00:37:31

Windows Redis 開機啓動後臺運行

1. 從 Redis 的安裝目錄進入 cmd 2. 在 cmd 中輸入, 將Redis綁定爲 Windows 服務, 並設置爲後臺啓動： redis-server --service-install redis.windows.con

2024-05-13 23:37:31

記一次特別的未授權訪問

某個夜裏，隨手點進去的一個小程序，引發的連鎖反應。開局一個小程序：登錄方式令人發愁，嘗試收集，無果。數據交互的地方說不定有sql，再次嘗試，還是無果。複製連接去web端，看看有沒有什麼收穫：好熟悉的界面，這不是SpringB

2024-05-13 23:18:59

cheerp 編譯器之通用計算模塊ccm1

cheerp 通用計算模塊(ccm1) 是基於cheerp 編譯器發射出平臺格式無關的wasm中間代碼，在不同宿主之內運行的一種模塊化方式。 0x1. 不同宿主的相同代碼實現 ccm1 的一般宿主是c++實現，不同平臺編譯引用就可以，目

2024-05-12 21:53:46

Java程序員5面阿里終獲offer，感慨：原來阿里面試這麼嚴

坊間傳言的阿里P6招聘需求感覺面試還是主要圍繞簡歷來問的，所以不熟悉的東西最好不要隨便寫上去。項目和基礎都很重要，項目中最好有難點，能夠體現自己解決問題的過程和思路。電話面：自我介紹事務的特性 ACID ，

2024-05-11 14:54:29

一招MAX降低10倍，現在它是我的了| 京東零售技術團隊

一.背景性能優化是一場永無止境的旅程。到家門店系統，作爲到家核心基礎服務之一，門店C端接口有着調用量高，性能要求高的特點。 C端服務經過演進，核心接口先查詢本地緩存，如果本地緩存沒有命中，再查詢Redis。本地緩存命中率99%，服務性能

2024-05-10 12:41:31

深入理解分佈式鎖：原理、應用與挑戰| 京東物流技術團隊

前言在單機環境中，我們主要通過線程間的加鎖機制來確保同一時間只有一個線程能夠訪問某個共享資源或執行某個關鍵代碼塊，從而防止各種併發修改異常。例如，在Java中提供了synchronized/Lock。但是在分佈式環境中，這種線程間的鎖機制

2024-05-10 00:30:02

營銷權益平臺春晚技術探究| 京東雲技術團隊

一、引言在當前快速發展的互聯網環境中，許多企業和服務都面臨着高併發場景的挑戰。隨着用戶規模不斷增長，對於同一時間內大量用戶請求的處理能力、系統性能、穩定性和容錯性的要求也日益提高。高併發場景對系統架構設計、數據庫設計、緩存策略、自動化運

2024-05-07 23:17:14

CCE雲原生混部場景下的測試案例

本文分享自華爲雲社區《CCE雲原生混部場景下在線任務搶佔、壓制離線任務CPU資源、保障在線任務服務質量效果測試》，作者：可以交個朋友。背景企業的 IT 環境通常運行兩大類進程，一類是在線服務，一類是離線作業。在線任務：運行時間長，服

2024-05-07 10:33:03

Spring boot自動裝配實現原理

自動裝配原理分析條件註冊機制 spring-context模塊中有兩個組件：Condition接口和@Conditional註解，在@Conditional註解中可以指定一組Condition實現，通常@Conditional是和@Co

2024-05-16 23:48:07

24小時熱門文章

通過HPA+CronHPA組合應對業務複雜彈性伸縮場景

最新文章

最新評論文章