kafka-python_&&_pysparkStreamingContext

原創

2019-03-27 05:26

# coding=utf-8

from pyspark import SparkContext
from pyspark.streaming import StreamingContext


sc = SparkContext("yarn","stream_test")
ssc = StreamingContext(sc,1)

# monitor:  nc -lk 9999
lines = ssc.socketTextStream('localhost',9999)
lines.pprint()

ssc.start()
# ssc.awaitTermination()
ssc.awaitTerminationOrTimeout(100)


# lines = ssc.socketTextStream("localhost",9999)
# words = lines.flatMap(lambda line: line.split(" "))
# pairs = words.map(lambda word: (word,1))
# wordCounts = pairs.reduceByKey(lambda x,y: x+y)
#
# wordCounts.pprint()

# coding=utf-8

from kafka import KafkaConsumer,KafkaProducer
import logging
import json


def kafka_consumer(kafkatopic, groupid, server):
    consumer = KafkaConsumer(
        kafkatopic,
        group_id = groupid,
        bootstrap_servers = server,
        session_timeout_ms = 15000,
        auto_commit_interval_ms = 1000,
        enable_auto_commit = True
    )
    for message in consumer:
        logging.info(message)
        print(message)


def kafka_producer(kafkatopic, server):
    producer = KafkaProducer(
        bootstrap_servers = server,
        value_serializer = lambda v: json.dumps(v).encode('utf-8')
    )
    for i in range(10):
        producer.send(kafkatopic, {i: i**2})
        print(producer.metrics())
    producer.close()


if __name__ == '__main__':
    # kafka_consumer(
    #     kafkatopic = "topic_consumer_xxx",
    #     groupid = "unique_guess",
    #     server = ['10.1.3.xxx:9092','10.1.4.xxx:9092','10.1.5.xxx:9092']
    # )
    kafka_producer(
        server = ['10.1.3.xxx:9092','10.1.4.xxx:9092','10.1.5.xxx:9092'],
        kafkatopic='topic_producer_xxx'
    )

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

kafka-python_&&_pysparkStreamingContext

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

lightgbm(gpu)在linux(centos7)安裝

spark sql 中排序的坑

terminal及vim高亮

tensorflow2.x使用cuda10.2(非常簡單)

pyspark參數設置，常用時間函數

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結