SparkStreaming连接Kafka两种方式

Spark Streaming支持从多种数据源获取数据,其中就包括 Kafka,要想从 数据源获取数据,首先要建立两者之间的连接,本节来介绍两种连接Kafka的方式。

1.Receiver based Approach:

(1)KafkaUtils.createDstream基于接收器方式,消费Kafka数据已淘汰企业中不再使用;

(2)Receiver作为常驻的Task运行在Executor等待数据,但是一个Receiver效率低,需要开启多个,再手动合并数据(union),再进行处理,很麻烦;

(3)Receiver那台机器挂了,可能会丢失数据,所以需要开启WAL(预写日志)保证数据安全,那么效率又会降低;

(4)Receiver方式是通过zookeeper来连接kafka队列,调用Kafka高阶API,offset存储在zookeeper,由Receiver维护

(5)Spark在消费的时候为了保证数据不丢也会在Checkpoint中存一份offset,可能会出现数据不一致;

2.· Direct Approach (No Receivers):

(1)

KafkaUtils.createDirectStream直连方式,Streaming中每批次的每个job直接调用Simple Consumer API获取对应Topic数据,此种方式使用最多,面试时被问的最多;

(2)Direct方式是直接连接kafka分区来获取数据,从每个分区直接读取数据大大提高并行能力

(3)Direct方式调用Kafka低阶API(底层APl),offset自己存储和维护,默认由Spark维护在checkpoint中,消除了与zk不一致的情况

(4)当然也可以自己手动维护,把offset存在MySQL/Redis中;

SparkStreaming连接Kafka两种方式
两种API

Spark Streaming与Kafka集成,有两套API,原因在于Kafka Consumer API有两套,文档:

http://spatkapathe.org/docs/2.4.5/streaming-kafka-integration.html

http://spark apache.org/docs/latest/streaming-kafka-integration.html

Kafka0.8.x版本-早已淘汰

底层使用老的KafkaAPI:Old Kafika Consumer API

支持Receiver(已淘达)和Direct模式:

Kafka 0.10.x版本-开发中使用

底层使用新的KafkaAPI:New Kafka Consumer API

只支持Direct模式

两个版本API
SparkStreaming连接Kafka两种方式

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:SparkStreaming连接Kafka两种方式 https://www.dachanpin.com/a/cyfx/10880.html

(0)
上一篇 2023-05-12
下一篇 2023-05-12

相关推荐

  • 乐视网退市倒计时!节前创业板还有15颗雷需避险

    乐视网退市倒计时!节前创业板还有15颗雷需避险 分享到 关注中金在线: 扫描二维码 关注√ 中金在线微信 在线咨询: 扫描或点击关注中金在线客服   乐视网退市倒计时!节前创业板还有15颗雷需避险   连续三个跌停,在又经过9.37亿元资金的激烈角逐后,曾经的创业板“大哥大”乐视网于2019年4月26日正式停牌。在2012年底至2015年的牛市阶段,乐视网股…

    2023-05-13
    7700
  • 如何成为一个优秀的技术领导者?

      参会收获   关于GTLC   如何最快建立权威并领导一个空降团队?   3、20+不同领域、不同经历的顶尖CTO,倾力分享独家实践、探索与感悟,为你展示技术领导力未知的魅力!   携程旅行网CTO & 高级技术副总裁,负责携程的移动、Online、呼叫中心等的技术架构、开发及运营。在加入携程之前,叶亚明是ebay.com技术平台总监,领导eba…

    创业分享 2023-06-16
    11700
  • 塔城地区多举措促进民众就业创业工作

    塔城地区多举措促进民众就业创业工作 市场信息网   2017-04-10 10:15:25   来源: 新闻中心   评论:   今年以来,地区人社局以贯彻落实地委扩大会和自治区人社工作会议精神为总领,进一步提升理解力、执行力、落实力,把思想和行动统一到地委、行署中心工…

    创业分享 2023-05-24
    9400
  • 7大女性创业项目落户天津 百余位创业者达成合作

    讲天津故事,传天津文化,聚天津力量!扫描二维码阅读更多精彩内容。 原标题:女性创业7大项目 在市妇联的协调和推动下,7大女性创业项目落户天津。目前,本市已有120多位女性创业者与这7个项目达成合作意向。这7大项目分别为:鲜炖燕窝品牌“小仙炖”、知名龙虾连锁店品牌“辣家私厨”、轻奢珠宝集合品牌“無有乐园”、国内在线外语口语品牌“微语言”、国内首创美妆咖啡以及同…

    创业分享 2023-05-27
    5800
  • 做干事创业者坚强后盾

    走向网络强国的中国经验 2019-07-24 15:22 美国的长臂管辖:概念、实践及其应对 新中国经济建设70载的辉煌成就 历史深刻表明,爱国主义自古以来就流淌在中华民族血脉之中,去不掉,打不破,灭不了。我们纪念五四运动、发扬五四精神,必须缅怀五四先驱崇高的爱国情怀和革命精神。 2019-06-24 18:40 2019-05-06 17:09 在世界多极…

    创业分享 2023-05-12
    5500

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信