SparkStreaming连接Kafka两种方式

Spark Streaming支持从多种数据源获取数据,其中就包括 Kafka,要想从 数据源获取数据,首先要建立两者之间的连接,本节来介绍两种连接Kafka的方式。

1.Receiver based Approach:

(1)KafkaUtils.createDstream基于接收器方式,消费Kafka数据已淘汰企业中不再使用;

(2)Receiver作为常驻的Task运行在Executor等待数据,但是一个Receiver效率低,需要开启多个,再手动合并数据(union),再进行处理,很麻烦;

(3)Receiver那台机器挂了,可能会丢失数据,所以需要开启WAL(预写日志)保证数据安全,那么效率又会降低;

(4)Receiver方式是通过zookeeper来连接kafka队列,调用Kafka高阶API,offset存储在zookeeper,由Receiver维护

(5)Spark在消费的时候为了保证数据不丢也会在Checkpoint中存一份offset,可能会出现数据不一致;

2.· Direct Approach (No Receivers):

(1)

KafkaUtils.createDirectStream直连方式,Streaming中每批次的每个job直接调用Simple Consumer API获取对应Topic数据,此种方式使用最多,面试时被问的最多;

(2)Direct方式是直接连接kafka分区来获取数据,从每个分区直接读取数据大大提高并行能力

(3)Direct方式调用Kafka低阶API(底层APl),offset自己存储和维护,默认由Spark维护在checkpoint中,消除了与zk不一致的情况

(4)当然也可以自己手动维护,把offset存在MySQL/Redis中;

SparkStreaming连接Kafka两种方式
两种API

Spark Streaming与Kafka集成,有两套API,原因在于Kafka Consumer API有两套,文档:

http://spatkapathe.org/docs/2.4.5/streaming-kafka-integration.html

http://spark apache.org/docs/latest/streaming-kafka-integration.html

Kafka0.8.x版本-早已淘汰

底层使用老的KafkaAPI:Old Kafika Consumer API

支持Receiver(已淘达)和Direct模式:

Kafka 0.10.x版本-开发中使用

底层使用新的KafkaAPI:New Kafka Consumer API

只支持Direct模式

两个版本API
SparkStreaming连接Kafka两种方式

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:SparkStreaming连接Kafka两种方式 https://www.dachanpin.com/a/cyfx/10880.html

(0)
上一篇 2023-05-12 02:28:10
下一篇 2023-05-12 02:29:13

相关推荐

  • 第六届中国创业者大会开幕 创业大咖聚郑 分享创业经验

    摘要   昨日,第六届中国创业者大会在郑州国际会展中心开幕,本届大会设有1个主会场加4个特色分会场。以新经济、新物种、新驱动为主题,涵盖人工智能、大数据、新物种、互联网+、物联网、区块链技术与应用、产业升级转型等20个领域。   有赞创始人白鸦、云和数据董事长郭凯、有间全球购创始人吴晓雨、UU跑腿创始人乔松涛、一步用车创始人兼CEO尚昊峰、亿达中国产业研究院…

    创业分享 2023-05-16
    70
  • 成都牵手北上深 成立城市创新创业服务联盟

    20日,又一场“双创”重磅活动落地成都,2019年“创响中国”首站暨“菁蓉汇雏鹰计划”在成都高新区菁蓉汇起航。 活动上,城市创新创业服务联盟宣布成立。该联盟由第一届至第四届全国大众创业万众创新活动周的举办地——北京中关村、深圳湾创业广场、上海长阳创谷、成都菁蓉汇联合发起,并邀请后续各主会场活动举办城市加入。 此外,活动上成都高新区宣布“菁蓉汇雏鹰计划”起航,…

    创业分享 2023-05-13
    76
  • 大特保创始人离世 创业不易又一创业者猝死

        原标题:大特保创始人离世 创业不易又一创业者猝死     10月20日下午,互联网保险平台大特保发布讣告称,大特保创始人兼CEO周磊(Jacky)因突发心脑血管疾病,2018年10月20日15:05于上海逝世,享年45岁。     当天下午17:59周磊的微信朋友圈也被同步了相关消息,其中内…

    2023-05-14
    84
  • 2023中国程序员薪酬报告出炉,你拖后腿了吗?

    程序员薪资高已是公认的事实,但是具体高到什么程度呢?近期,全球人力服务公司 Michael Page Internatioal 就发布了《2023 中国大陆薪酬报告》,揭示了中国程序员的薪酬情况。 该报告中一共调研了国内 7 个行业以及 6 大城市不同职级以及不同岗位的薪资水平,以下是播妞在报告中挑选的和技术、职场等相关的内容,一起来看看: 中国大陆的人才市…

    2023-05-12
    94
  • 如何做好创业公司CEO

      那么,这些大佬,成功者,是不是已经落伍了,是不是只停留在过去了?其实没有,我真心说,真的没有,参见这篇, 大佬们的智囊团 。他们的信息资源,远远超过你们的想象。但是,当前仍然有效,仍然可用,仍然极有机会的领域,以及他们正在研究和深入探索的市场,很抱歉,一个字都不会告诉你!   一个公众号,一个微信小程序,不用说小团队,一个人,好好琢磨产品,好好琢磨用户,…

    创业分享 2023-05-23
    113

发表回复

登录后才能评论

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信