SparkStreaming消费kafka数据堆积问题(即生产者生产数据速率>>消费者消费数据速率)

原創

Morgan_Mu

2019-04-28 15:08

Spark直连kafka解决方案：

注意：spark直连kafka spark的分区数和kafka的分区数是一致的

1.增加kafka的分区数，相当于增加了spark的分区数，分区数增加处理数据能力上升。但是分区数量不要少于服务器(exector服务器)的cpu核数，spark官方提示分区数要是cpu总核数的2~3倍

Kafka增加分区的命令:

./kafka-topics.sh --zookeeper localhost:2181 -alter --partitions 4 --topic test1

2.增加每个分区的内存数量，在执行spark程序的命令中指定 --executor (x)G --driver (x)G。

增加了内存数量降低程序的运行时间。

3.增加服务器的数量。服务器数量增加spark的节点相对应的增加，节点增加会将原来数据分发到多的节点上进行数据的处理，增加速率。

4.最优处理方式就是，增加服务器数量的同时也增加kafka分区的数量（相当于增加spark的分区数量），两种方式同时增加对消费数据速率有大幅度提升。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

spark-25.spark调优_3_spark资源配置

1.資源運行中的幾種情況實踐中跑的SparkJob，有的特別慢，查看CPU利用率很低，可以嘗試減少每個executor佔用的CPU core的數量，增加並行的executor數量，同時配合增加分片，整體上增加了CPU的利用率，

蒙面小生

2020-07-04 08:37:58

spark-27.spark调优_5_Shuffle优化

spark.shuffle.file.buffer spark.shuffle.file.buffer默認值：32k 參數說明：該參數用於設置shuffle write task的BufferedOutputStream的bu

蒙面小生

2020-07-04 08:37:58

Spark性能调优---JVM调优之调节executor堆外内存与连接等待时长

一、executor堆外內存 ①理論在實際項目中，有時候需要處理大量的數據，比如上億、數十億條數據，發現項目時不時地報錯：shuffle file not found,executor lost,task lost,out of mem

Johnson8702

2020-07-02 01:26:47

Spark的统一内存管理

Spark的統一內存管理圖1：統一內存管理 spark 1.6之後引入的統一內存管理機制。統一內存管理的結構是： -----

Morgan_Mu

2020-06-23 00:38:07

Spark调优详解

数据小二

2020-02-22 13:00:03

Spark性能优化-Shuffer调优

青于蓝胜于蓝

2020-02-21 16:25:38

Spark性能优化：资源调优篇

青于蓝胜于蓝

2020-02-21 16:25:37

Spark on yarn 的两种模式不同之处（spark on yarn的内存分配）

Morgan_Mu

2019-08-23 04:00:19

SparkStreaming性能调优

Johnson8702

2019-04-26 06:47:15

Spark SQL数据倾斜解决方案

Johnson8702

2019-03-11 20:24:45

Spark性能调优---算子调优

Johnson8702

2019-03-06 13:43:22

Spark性能调优---JVM调优之原理概述及降低cache操作的内存占比

Johnson8702

2019-02-28 21:59:52

shuffle原理及调优

Johnson8702

2019-02-27 22:09:25

三、Spark性能优化：数据倾斜调优

tianlan996

2018-12-28 17:36:04

一、Spark性能优化：开发调优篇

tianlan996

2018-12-28 17:36:04

24小時熱門文章

SparkStreaming消费kafka数据堆积问题(即生产者生产数据速率>>消费者消费数据速率)

工作中用到的脚本合集

通过f-string编写简洁高效的Python格式化输出代码

24-5-18 X

kafka命令總結與講解

JVM各組件的功能

Spark的統一內存管理

Flink消費0.10版本kafka

Spark Task 級調度

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結