SparkStreaming连接Kafka两种方式

Spark Streaming支持从多种数据源获取数据,其中就包括 Kafka,要想从 数据源获取数据,首先要建立两者之间的连接,本节来介绍两种连接Kafka的方式。

1.Receiver based Approach:

(1)KafkaUtils.createDstream基于接收器方式,消费Kafka数据已淘汰企业中不再使用;

(2)Receiver作为常驻的Task运行在Executor等待数据,但是一个Receiver效率低,需要开启多个,再手动合并数据(union),再进行处理,很麻烦;

(3)Receiver那台机器挂了,可能会丢失数据,所以需要开启WAL(预写日志)保证数据安全,那么效率又会降低;

(4)Receiver方式是通过zookeeper来连接kafka队列,调用Kafka高阶API,offset存储在zookeeper,由Receiver维护

(5)Spark在消费的时候为了保证数据不丢也会在Checkpoint中存一份offset,可能会出现数据不一致;

2.· Direct Approach (No Receivers):

(1)

KafkaUtils.createDirectStream直连方式,Streaming中每批次的每个job直接调用Simple Consumer API获取对应Topic数据,此种方式使用最多,面试时被问的最多;

(2)Direct方式是直接连接kafka分区来获取数据,从每个分区直接读取数据大大提高并行能力

(3)Direct方式调用Kafka低阶API(底层APl),offset自己存储和维护,默认由Spark维护在checkpoint中,消除了与zk不一致的情况

(4)当然也可以自己手动维护,把offset存在MySQL/Redis中;

SparkStreaming连接Kafka两种方式
两种API

Spark Streaming与Kafka集成,有两套API,原因在于Kafka Consumer API有两套,文档:

http://spatkapathe.org/docs/2.4.5/streaming-kafka-integration.html

http://spark apache.org/docs/latest/streaming-kafka-integration.html

Kafka0.8.x版本-早已淘汰

底层使用老的KafkaAPI:Old Kafika Consumer API

支持Receiver(已淘达)和Direct模式:

Kafka 0.10.x版本-开发中使用

底层使用新的KafkaAPI:New Kafka Consumer API

只支持Direct模式

两个版本API
SparkStreaming连接Kafka两种方式

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:SparkStreaming连接Kafka两种方式 https://www.dachanpin.com/a/cyfx/10880.html

(0)
上一篇 2023-05-12 02:28:10
下一篇 2023-05-12 02:29:13

相关推荐

  • 投资悟川烧烤外卖如何?80后创业者给出他的答案

    李刚是一名80后创业者,在大学毕业后,便开始做起了自己的小生意,先后从事过很多行业,有餐饮有工业,在近一年的时间里,烧烤在市场上越来越火爆,他也从中选择了一个自己比较看好的项目,并对其展开调查。 悟川烧烤的总部实力雄厚,为李刚开店提供了方方面面的服务,从选址到运营指导,每一个环节都在总部的指导下顺利通过。总部在当地市场做了大量的调查分析后,协助他在一个交通方…

    创业分享 2023-06-16
    173
  • 施甸放宽“贷免扶补”担保制度帮助农村妇女创业

    张海彪是大中村的第一个大学本科生,2015年7月,毕业于云南大学动物科学专业的张海彪用自己学到的专业回乡发展林下养殖,他同母亲商议后,以母亲为创业法人进行“贷免扶补”创业贷款,一年后,他的养殖场就养出了23671只飞鸡,实现收入22万元。“贷免扶补”扶持的不仅仅只有大学生,有很多农村妇女就是借助这笔资金从传统的家庭主妇转变为家庭农场主。由旺镇中村的农村妇女王…

    创业分享 2023-05-31
    124
  • 大力推动大学生创新创业

    标题导航     本报沈阳专电(记者董国勋)近年来,我省大学生创新创业工作有了良好发展势头。但在实施过程中仍然存在着认识水平与推动力度不平衡的问题。昨日,在省十三届人大一次会议大连代表团分组审议中,省人大代表、大连大学副校长李玉光认为,加强我省大学生创新创业工作,不仅将推动创新驱动、解决大学生就业创业问题,也将起到增强…

    创业分享 2023-05-20
    114
  • 创业时怎么应对问题

      创业之路极其坎坷崎岖,有时生意进展很慢,会面临很多挑战。   及时行动并抛弃对完美的执著,你就有机会孤注一掷,大获全胜。   经营一个小企业向来要花很多钱。小型企业通常起步价就得三万,运营费用也紧追其后。尽管小型家庭企业的日常开销很少,但他们还得承担昂贵的机会投资。与在一份稳定的工作上赚取理想的工资和福利不同,创业时你要承担为自己赚钱的责任。   3 完…

    创业分享 2023-05-21
    117
  • 晋江出台政策鼓励吸引大学生就业创业 中国劳动保障新闻网

      《意见》加大了保障就业、鼓励创业、注重帮扶三个方面的力度。在保障就业方面,放宽用人单位吸纳高校毕业生社保补贴、优秀毕业生社会保险补贴、自助创业高校毕业生适用条件,扩大政策受惠面,鼓励吸纳高校毕业生就业。鼓励创业方面,每年举办大学生创新创业大赛,并分别给予优秀项目、落地项目3千-1万元、1万-3万元奖励。对大学生创业项目采取工商注册专人专件办理、场租优惠、…

    创业分享 2023-05-13
    130

发表回复

登录后才能评论

联系我们

在线咨询: QQ交谈

邮件:362039258@qq.com

工作时间:周一至周五,9:30-16:30,节假日休息