SparkStreaming连接Kafka两种方式

Spark Streaming支持从多种数据源获取数据,其中就包括 Kafka,要想从 数据源获取数据,首先要建立两者之间的连接,本节来介绍两种连接Kafka的方式。

1.Receiver based Approach:

(1)KafkaUtils.createDstream基于接收器方式,消费Kafka数据已淘汰企业中不再使用;

(2)Receiver作为常驻的Task运行在Executor等待数据,但是一个Receiver效率低,需要开启多个,再手动合并数据(union),再进行处理,很麻烦;

(3)Receiver那台机器挂了,可能会丢失数据,所以需要开启WAL(预写日志)保证数据安全,那么效率又会降低;

(4)Receiver方式是通过zookeeper来连接kafka队列,调用Kafka高阶API,offset存储在zookeeper,由Receiver维护

(5)Spark在消费的时候为了保证数据不丢也会在Checkpoint中存一份offset,可能会出现数据不一致;

2.· Direct Approach (No Receivers):

(1)

KafkaUtils.createDirectStream直连方式,Streaming中每批次的每个job直接调用Simple Consumer API获取对应Topic数据,此种方式使用最多,面试时被问的最多;

(2)Direct方式是直接连接kafka分区来获取数据,从每个分区直接读取数据大大提高并行能力

(3)Direct方式调用Kafka低阶API(底层APl),offset自己存储和维护,默认由Spark维护在checkpoint中,消除了与zk不一致的情况

(4)当然也可以自己手动维护,把offset存在MySQL/Redis中;

SparkStreaming连接Kafka两种方式
两种API

Spark Streaming与Kafka集成,有两套API,原因在于Kafka Consumer API有两套,文档:

http://spatkapathe.org/docs/2.4.5/streaming-kafka-integration.html

http://spark apache.org/docs/latest/streaming-kafka-integration.html

Kafka0.8.x版本-早已淘汰

底层使用老的KafkaAPI:Old Kafika Consumer API

支持Receiver(已淘达)和Direct模式:

Kafka 0.10.x版本-开发中使用

底层使用新的KafkaAPI:New Kafka Consumer API

只支持Direct模式

两个版本API
SparkStreaming连接Kafka两种方式

免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:SparkStreaming连接Kafka两种方式 https://www.dachanpin.com/a/cyfx/10880.html

(0)
上一篇 2023-05-12 02:28:10
Sqoop是什么工具?Sqoop工作流程是什么?
下一篇 2023-05-12 02:29:13

相关推荐

  • 德阳市部署就业创业和职业技能提升工作

    据悉,今年1-6月,德阳全市城镇新增就业26408人,完成全年目标任务的58.68%,全市城镇登记失业率3.70%,低于省下达控制目标0.5个百分点。全市农村劳动力转移就业114.4万人,农民工累计返乡创业21022人。全市共促进1924名2018届离校未就业高校毕业生实现就业,促进669名大学生实现创业,引导1652名大学生到基层实现就业。全市有就业愿望和…

    创业分享 2023-05-13
    131
  • 餐饮行业创业励志故事

    首页 > 新闻列表 > 正文 餐饮行业创业励志故事 来源网络 发布时间:2018-08-23 04:01:48 此页面信息为商业广告 s1802餐饮行业创业励志故事yuandong1 餐饮业是我国较早放的行业。国际知名餐饮企业的不断涌进,对我国餐饮业的经营理念、服务质量标准、文化氛围、饮食结构、从业人员素质要求等产生了深刻影响。备受消费者推崇的原…

    创业分享 2023-05-16
    157
  • 大四女生练摊积创业经验

    在三角镇新春创业集市上活跃着一群年轻人 大四女生练摊积创业经验 来源:中山日报 2016-02-07 第 7692 期 A3版 发布日期:2016年2月7日      2月3日,三角镇孝福路旁的新春创业集市洋溢着新春的气息。     “来,小弟弟,我教你怎么制作漂亮的手工手链,然…

    创业分享 2023-05-21
    97
  • A股多重利空伴随监管重拳释放 创业板隐患尚未解除

    恒大概念股跌幅排名   此外,恒大还有恒大集团的名义持有4只个股,分别是嘉凯城(000918,股吧)(000918.SZ)、廊坊发展(600149,股吧)(600149.SH)、万科A(00002.SZ)和梅雁吉祥(600868,股吧)(600868.SH)。此前,恒大人寿清仓梅雁吉祥短炒获利后,被舆论与监管层关注。随后,恒大集团控制的仲勤投资买入梅雁吉祥达…

    创业分享 2023-05-26
    220
  • 河北平泉:优惠政策引能人创业

      平泉深化人才体制机制改革,成为首批农民工返乡创业试点县。目前全市返乡创业人数达到5621人,其中返乡能人创办的市场主体达到1045个。   “硬环境要硬,软环境绝不能软,将‘店小二’的服务理念落地,为返乡创业者营造良好的发展环境。” 董正国说,平泉推行“办事一次成”,开展一站式服务,对落地项目安排企业服务经理人,专人为企业全程帮办。   前几年,唐志强的…

    创业分享 2023-05-16
    151

发表回复

登录后才能评论

联系我们

在线咨询: QQ交谈

邮件:362039258@qq.com

工作时间:周一至周五,9:30-16:30,节假日休息