当前位置: 首页 > news >正文

营销型网站模板电商网站开发过程

营销型网站模板,电商网站开发过程,单页网站的区别,大连网站设计菲尔莱斯面试题来源#xff1a; 《大数据面试题 V4.0》 大数据面试题V3.0#xff0c;523道题#xff0c;679页#xff0c;46w字 可回答#xff1a;1#xff09;Spark Streaming和Flink的区别 问过的一些公司#xff1a;杰创智能科技(2022.11)#xff0c;阿里蚂蚁(2022.11) 《大数据面试题 V4.0》 大数据面试题V3.0523道题679页46w字 可回答1Spark Streaming和Flink的区别 问过的一些公司杰创智能科技(2022.11)阿里蚂蚁(2022.11)阿里云(2022.10)(2019.03)携程(2022.10)银联(2022.10)顺丰(2022.09)(2022.05)贝壳(2022.09)美团(2022.09)字节(2022.08)x2(2022.05)(2022.04)(2021.10)(2021.08)兴金数金(2022.08)星环科技(2022.07)西安华为实习(2022.05)小红书(2022.04)欢聚(2021.09)蔚来(2021.09)百度提前批(2021.08)网易严选(2021.08)(2019.08)字节社招(2021.05)字节实习(2021.03)中信银行信用卡中心(2020.11)招银网络(2020.09)转转(2020.09)美团优选社招(2020.09)x2触宝(2020.09)京东(2020.08)网易(2020.08)(2018.11)竞技世界(2020.08)趋势科技(2020.08)美团实习(2020.04)华为实习(2020.04)美团(2020.04)快手(2020.03)爱奇艺(2020.03)蘑菇街实习(2020.03)嘉云数据(2020.01)360社招(2020.01)阿里(2018.11) 参考答案 1、编程模型方面 Spark基于批处理模型将连续的数据流划分成一系列的微批处理batch并在每个微批处理中执行Spark RDD操作。因此它采用了与Spark相同的编程模型允许开发人员使用Scala、Java或Python进行编程。 Flink则基于数据流模型数据以流的形式输入和输出支持连续数据处理和有限数据处理。开发人员可以使用Flink提供的DataStream API编写处理逻辑这些API提供了类似于Spark RDD的转换和操作。 2、数据处理模式方面 Spark将数据流划分成微批处理并在每个微批处理中执行一组操作因此它是一个基于“微批”micro-batch的引擎。这意味着在处理每个微批处理时Spark Streaming会等待所有数据到达批处理因此会存在一定的延迟延迟是秒级。 Flink则是一个基于“事件时间”event time的引擎。它支持流式处理和批处理可以根据事件时间对数据进行有序处理避免了由于乱序数据引起的问题。因此Flink处理数据时可以保证更低的延迟和更高的准确性延迟能够达到毫秒级。 3、架构模型方面 Spark Streaming在运行时的主要角色包括Master、Worker、Driver、Executor Flink 在运行时主要包Jobmanager、Taskmanager 和 Slot。 4、任务调度 Spark Streaming连续不断的生成微小的数据批次构建有向无环图DAGSpark Streaming会依次创DStreamGraph、JobGenerator、JobScheduler。 Flink 根据用户提交的代码生成 StreamGraph经过优化生成 JobGraph然后提交给JobManager 进行处理 JobManager 会根据 JobGraph 生成 ExecutionGraphExecutionGraph 是 Flink 调度最核心的数据结构JobManager 根据 ExecutionGraph 对 Job 进行调度。 5、时间机制 Spark Streaming支持的时间机制有限只支持处理时间。 Flink支持了流处理程序在时间上的三个定义处理时间、事件时间、注入时间。同时也支持watermark机制来处理滞后数据。 6、容错机制 对于Spark Streaming任务可以设置Checkpoint然后假如发生故障并重启可以从上次Checkpoint之处恢复但是这个行为只能使得数据不丢失可能会重复处理不能做到恰好一次处理语义。利用Spark Streaming的direct方式与Kafka可以保证数据输入源的处理过程输出过程符合Exactly Once。 Flink则使用两阶段提交协议来保证Exactly Once。 7、数据方面 在Flink的世界观中一切都是由流组成的离线数据是有界限的流实时数据是一个没有界限的流这就是所谓的有界流和无界流。流处理的特点是无界、实时, 无需针对整个数据集执行操作而是对通过系统传输的每个数据项执行操作一般用于实时统计。 在Spark的世界观中一切都是由批次组成的离线数据是一个大批次而实时数据是由一个一个无限的小批次组成的。批处理的特点是有界、持久、大量非常适合需要访问全套记录才能完成的计算工作一般用于离线统计。 8、应用场景方面 Flink的延迟是毫秒级别而Spark Streaming的延迟是秒级延迟。 Flink更适合实时流数据处理和事件驱动应用。它是专门设计用于流式数据处理的框架可以对实时数据流进行高效的计算和处理。 Spark最初是为批处理而设计的它非常适合对大规模的数据集进行批处理分析还通过其SQL查询功能提供快速的交互式查询。 Spark Structured Streaming支持实时流处理但相对于Flink在处理延迟和状态管理方面可能稍逊一些。
http://www.yutouwan.com/news/193133/

相关文章:

  • 外贸网站设计公司海南网站建设粤icp备
  • 鞋材东莞网站建设网站开发语言为
  • wordpress注册可见插件青岛seo关键词排名
  • 邯郸哪儿做网站便宜四川教育公共信息服务平台
  • 广东茶叶网站建设php网站mysql数据库导入工具
  • 老外做牛排的视频网站微信公众号私自建设电影网站
  • 平面设计有什么网站凡科互动游戏修改速度
  • 网站建设属于会计哪个科目做阀门网站电话号码
  • 有什么可以做翻译的网站吗用vs2010做网站登入
  • 科技网站制作高德地图能在国外用吗
  • 视频网站开发 价格域名服务器有哪几种
  • 怎么seo网站关键词优化国家企业信用公示信息查询平台
  • 温州微网站重庆施工许可证查询
  • 南昌做任务的网站工信部网站域名备案信息查询
  • 重庆推广网站中企动力 网站价格
  • 做网站步骤响应网站怎么做
  • 电子商城网站建设方案wordpress上传音乐
  • 淄博网站制作网络丰富app手机网站
  • excel做网站二维码国内著名展馆设计公司报价
  • 苍南最好的网站建设公司可以做公众号背景图的网站
  • 开一个网站建设公司需要什么国外 网页框架搭建的网站
  • 国外专业做汽配的网站如何在服务器建设iis网站
  • 长春网站优化常识jsp商业网站开发
  • 北京网站建设公司电话网站公司设计公司
  • 网站开发深怎么开网店无货源店铺
  • 台州市建设项目规划网站wordpress 商城 插件
  • 徐州网站制作方案设计h5是什么意思
  • 网站建设实例大制作上海建筑设计研究院有限公司招聘
  • 公司网站建设广州wordpress中联系表
  • 网站怎么做实名认证吗微信公众号开发需要什么技术