SparkStreaming连接Kafka两种方式

Spark Streaming支持从多种数据源获取数据,其中就包括 Kafka,要想从 数据源获取数据,首先要建立两者之间的连接,本节来介绍两种连接Kafka的方式。

1.Receiver based Approach:

(1)KafkaUtils.createDstream基于接收器方式,消费Kafka数据已淘汰企业中不再使用;

(2)Receiver作为常驻的Task运行在Executor等待数据,但是一个Receiver效率低,需要开启多个,再手动合并数据(union),再进行处理,很麻烦;

(3)Receiver那台机器挂了,可能会丢失数据,所以需要开启WAL(预写日志)保证数据安全,那么效率又会降低;

(4)Receiver方式是通过zookeeper来连接kafka队列,调用Kafka高阶API,offset存储在zookeeper,由Receiver维护

(5)Spark在消费的时候为了保证数据不丢也会在Checkpoint中存一份offset,可能会出现数据不一致;

2.· Direct Approach (No Receivers):

(1)

KafkaUtils.createDirectStream直连方式,Streaming中每批次的每个job直接调用Simple Consumer API获取对应Topic数据,此种方式使用最多,面试时被问的最多;

(2)Direct方式是直接连接kafka分区来获取数据,从每个分区直接读取数据大大提高并行能力

(3)Direct方式调用Kafka低阶API(底层APl),offset自己存储和维护,默认由Spark维护在checkpoint中,消除了与zk不一致的情况

(4)当然也可以自己手动维护,把offset存在MySQL/Redis中;

SparkStreaming连接Kafka两种方式
两种API

Spark Streaming与Kafka集成,有两套API,原因在于Kafka Consumer API有两套,文档:

http://spatkapathe.org/docs/2.4.5/streaming-kafka-integration.html

http://spark apache.org/docs/latest/streaming-kafka-integration.html

Kafka0.8.x版本-早已淘汰

底层使用老的KafkaAPI:Old Kafika Consumer API

支持Receiver(已淘达)和Direct模式:

Kafka 0.10.x版本-开发中使用

底层使用新的KafkaAPI:New Kafka Consumer API

只支持Direct模式

两个版本API
SparkStreaming连接Kafka两种方式

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:SparkStreaming连接Kafka两种方式 https://www.dachanpin.com/a/cyfx/10880.html

(0)
上一篇 2023-05-12 02:28:10
下一篇 2023-05-12 02:29:13

相关推荐

  • 出轨如果离婚,你承受得起吗?

     伴随着人们生活条件进步的同时,也不可避免地形成许多社会问题,少数人社会道德观、价值观的沦丧,很多家庭受到第三者的侵扰,妇女、儿童作为弱势群体,首当其冲受到损害,其中,这种婚外恋行为也成了影响社会安定团结的一种因素。 因此掌握证据是被害人利用法律手段维护自身权益和尊严的唯一合法途径。 东莞侦探 出轨如果离婚,你承受得起吗?比较有意思的是,…

    创业分享 2023-05-12
    57
  • 打造以文创为主题的青年创业基地 宝山区大场镇“创业义诊”走进

    打造以文创为主题的青年创业基地 宝山区大场镇“创业义诊”走进园区   记者了解到,截至目前,已有上海美术学院南院、毛戈平化妆培训中心等90多个创业企业组织入驻昇PARK文创产业园基地,此类“义诊”活动也是宝山区大场镇镇政府为创业青年提供精准化创业服务、引导和帮助青年树立创业意识、提高创业能力创业激情,吸引更多青年创业者到大场创业的重要举措之一。   这场在昇…

    创业分享 2023-06-15
    115
  • 李亚飞:两岸互联网交流可做好电商和创业文章

      两岸互联网领域的交流合作,前景广阔,大有可为,怎样作好这篇文章?我想结合论坛议题谈几点意见,供大家参考。   生活因互联网而丰富,世界因互联网而精彩。网络愈来愈显示其联结人类交往的功能与作用,同时为世界各国经济社会的发展装上强劲引擎。当前,科技创新已成为大陆经济增长的新驱动力,互联网创新和发展已经成为大陆GDP的重要组成部分。国民经济和社会发展的&#82…

    2023-05-27
    69
  • 创业4年、融资10次、估值33亿:A股区块链公司在它面前都是垃圾!

    对于中国人来说,世界上最美妙的技术,就是能实现一夜暴富的技术,区块链和数字货币或许正中下怀,妙不可言。 用张楠赓的话来说,创业就是因为生活很无聊。读研期间,他偶然认识了比特币,并利用专业所学技术做成了用于挖比特币的机器,并卖到国外赚取外快。 2、下游客户: 2018年伊始,吴晓波的跨年演讲成为比罗振宇热度还高的跨年节目。 也正是嘉楠耘智的这一选择,让市场得以…

    创业分享 2023-05-24
    121
  • 星河互联:直击互联网创业痛点 上百模块提供一站式全程创业服务

    政策的红利、资金的倾斜让创业成为年度热词,也催熟了创业服务市场的发展。近日,国内领先的一站式互联网创业服务开放平台星河互联正式宣布,已完成内部整合,将星河空间、星河商学院、创保联、聘快线等原兄弟公司纳入旗下成为全资子公司,由控股公司升级为集团。   政策的红利、资金的倾斜让创业成为年度热词,也催熟了创业服务市场的发展。近日,国内领先的一站式互联网创业服务开放…

    2023-05-30
    141

发表回复

登录后才能评论

联系我们

在线咨询: QQ交谈

邮件:362039258@qq.com

工作时间:周一至周五,9:30-16:30,节假日休息