SparkStreaming连接Kafka两种方式

Spark Streaming支持从多种数据源获取数据,其中就包括 Kafka,要想从 数据源获取数据,首先要建立两者之间的连接,本节来介绍两种连接Kafka的方式。

1.Receiver based Approach:

(1)KafkaUtils.createDstream基于接收器方式,消费Kafka数据已淘汰企业中不再使用;

(2)Receiver作为常驻的Task运行在Executor等待数据,但是一个Receiver效率低,需要开启多个,再手动合并数据(union),再进行处理,很麻烦;

(3)Receiver那台机器挂了,可能会丢失数据,所以需要开启WAL(预写日志)保证数据安全,那么效率又会降低;

(4)Receiver方式是通过zookeeper来连接kafka队列,调用Kafka高阶API,offset存储在zookeeper,由Receiver维护

(5)Spark在消费的时候为了保证数据不丢也会在Checkpoint中存一份offset,可能会出现数据不一致;

2.· Direct Approach (No Receivers):

(1)

KafkaUtils.createDirectStream直连方式,Streaming中每批次的每个job直接调用Simple Consumer API获取对应Topic数据,此种方式使用最多,面试时被问的最多;

(2)Direct方式是直接连接kafka分区来获取数据,从每个分区直接读取数据大大提高并行能力

(3)Direct方式调用Kafka低阶API(底层APl),offset自己存储和维护,默认由Spark维护在checkpoint中,消除了与zk不一致的情况

(4)当然也可以自己手动维护,把offset存在MySQL/Redis中;

SparkStreaming连接Kafka两种方式
两种API

Spark Streaming与Kafka集成,有两套API,原因在于Kafka Consumer API有两套,文档:

http://spatkapathe.org/docs/2.4.5/streaming-kafka-integration.html

http://spark apache.org/docs/latest/streaming-kafka-integration.html

Kafka0.8.x版本-早已淘汰

底层使用老的KafkaAPI:Old Kafika Consumer API

支持Receiver(已淘达)和Direct模式:

Kafka 0.10.x版本-开发中使用

底层使用新的KafkaAPI:New Kafka Consumer API

只支持Direct模式

两个版本API
SparkStreaming连接Kafka两种方式

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:SparkStreaming连接Kafka两种方式 https://www.dachanpin.com/a/cyfx/10880.html

(0)
上一篇 2023-05-12 02:28:10
下一篇 2023-05-12 02:29:13

相关推荐

  • 创业市场消除性别差距 鼓励年轻女性创业

    经验:关注边缘人群 运用新技术 在周边会议中,部分杰出的青年女企业家和领导人分享了促进年轻女性创业的经验和建议。 在市场采购等环节为女企业家创造机会 所以,联盟的成立,标志着对年轻女性经济赋权的重要里程碑的开始。 ○ 通过公共和私人的具有性别敏感的采购为女企业家创造机会,并通过扩大对女企业家提供的商品和服务的需求,提高对女性经济赋权。 尽管有越来越多的证据表…

    创业分享 2023-05-30
    87
  • 阿里推“一键创业”平台,罗永浩回应被解约,App违法违规收集个

    展开全文 05 滴滴调整网约车平台:原独乘事业部升级为专车事业部和优享事业部 12月27日,滴滴对内小范围宣布了网约车平台的调整。组织架构上,原独乘事业部升级为专车事业部和优享事业部。此外,原策略运营中心升级为策略运营部,此次调整目的在于提升供需策略决策,优化运营。人事上,原滴滴副总裁、网约车区域总经理孙枢将离开原岗位,原华南区域总监朱泽涛将接替孙枢,担任网…

    2023-05-12
    93
  • 镭泽科技勇夺省创新创业大赛榜眼

      淄博新闻网讯 (记者 周剑楠 通讯员 高勐)近日,第五届山东省青年创新创业大赛暨第三届“创青春”中国青年创新创业大赛山东区选拔赛(商工组)落下帷幕。经过历时3个多月的激烈角逐,由淄川区大学生创业孵化中心成功孵化的山东镭泽智能科技有限公司的虹膜采集及识别系统在1500多支比赛队伍中脱颖而出,勇夺“榜眼”,并获得代表山东省参加全国比赛的资格。  &…

    创业分享 2023-05-28
    66
  • “蘑菇孢子”怎样绽放创业梦想

    面对新时代,9名曾经一起学习“种蘑菇”的优秀大学生,如今正一起在创业浪潮中乘风破浪。他们相信,自己虽然只是一颗渺小的蘑菇孢子,但是只要有机会,就会在大众创业万众创新的时代里,成长为一枚朴实无华但营养丰富的蘑菇,在互联网的森林里继续开创更加美丽的事业。(通讯员 陈胜伟) 当时,黄元斌从学院的刘兴泉老师那里,接触了一款名叫frontpage的基础网页制…

    创业分享 2023-05-16
    100
  • 以干事创业的实绩交卷

    政府工作报告强调,就业优先政策要全面发力。全国人大代表、中共北京市委委员、东城区委书记夏林茂表示,今年首次将就业优先政策置于宏观政策层面,旨在强化各方面重视就业、支持就业的导向。这充分体现了中央对民生问题的高度关注。 夏林茂代表介绍,北京市出台了促进就业工作的意见,明确了2019年城镇新增就业28万人,实施扶持创业6000人,带动就业2.4万人等具体工作目标…

    创业分享 2023-05-13
    103

发表回复

登录后才能评论

联系我们

在线咨询: QQ交谈

邮件:362039258@qq.com

工作时间:周一至周五,9:30-16:30,节假日休息