当前位置：Web开发网 » 操作系统 » linux系统 » 正文

hadoop和spark的区别？

2021年10月14日7610Web开发网百度已收录

Hadoop和Spark的区别解决问题的出发点不一样，Hadoop用普通硬件解决存储和计算问题。 Spark用于构建大型的、低延迟的数据分析应用程序，不实现存储。Spark是在借鉴了MapReduce之上发展而来的，继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷。Spark中间数据放到内存中，迭代运算效率高。

Spark引进了弹性分布式数据集的抽象，数据对象既可以放在内存，也可以放在磁盘，容错性高，可用自动重建，RDD计算时可以通过CheckPoint来实现容错。

Hadoop只提供了Map和Reduce操作。而Spark更加通用，提供的数据集操作类型有很多种，主要分为： Transformations和Actions两大类。

上一篇: spark真的要取代hadoop了么，还有阿里的flink未来会是一种趋势么？

下一篇: 大数据Spark技术是否可以替代Hadoop？

Hadoop

文章来源：Web开发网，欢迎分享，转载请保留出处
原文地址：https://kaifa5.com/7047.html

阅读延展

6年资深架构师：如何2月搞定hadoop？

Hadoop如何快速入门？

学习大数据Hadoop需要哪些基础？

IT企业利用云计算平台Hadoop的10种方式(转载)

spark比hadoop的优势在哪？

大数据如何让Hadoop走的更远(转载)

评论列表暂无评论

发表评论取消回复: 好顶踩