当前位置：Web开发网 » 操作系统 » linux系统 » 正文

在hadoop和spark之间如何取舍？

2021年10月14日8580Web开发网百度已收录

其实这两个工具之间一般并不存在取舍关系。

业界一般会结合试用这两个工具。

hadoop基于集群存储和分析调度的工具包，大家常用的有hdfs,mapreduce,yarn，属于平台基础设施，主要负责海量数据存储和并行计算调度。

而spark是个大数据快速分析工具，一般实在hadoop基础上运行（虽然也可独立运行），通过hadoop的yarn调度，实现海量数据的流式处理。

另外，spark也包含一个机器学习的库mllib，用来进行机器学习。

上一篇: 既然Spark比Hadoop性能好很多，Hadoop未来的发展方向是什么？

下一篇: 与Hadoop对比，如何看待Spark技术？

Hadoop

文章来源：Web开发网，欢迎分享，转载请保留出处
原文地址：https://kaifa5.com/7052.html

阅读延展

南京大数据hadoop网络培训，钜惠来袭！！！

大数据Spark技术是否可以替代Hadoop？

Spark和Hadoop对于大数据的关系？

hadoop为什么大吞吐量要求低时间延延迟的数据访问？

Hadoop与Spark相比有存在优势的方面吗？

评论列表暂无评论

发表评论取消回复: 好顶踩