当前位置：Web开发网 » 操作系统 » linux系统 » 正文

hadoop原理

2021年10月14日7530Web开发网百度已收录

hadoop原理：其最底部是 Hadoop Distributed File System（HDFS），它存储 Hadoop 集群中所有存储节点上的文件。HDFS的上一层是MapReduce

引擎，该引擎由 JobTrackers 和 TaskTrackers

组成。

通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程，以及数据仓库工具Hive和分布式数据库Hbase的介绍，基本涵盖了Hadoop分布式平台的所有技术核心。

Hadoop这个名字不是一个缩写，而是一个虚构的名字。该项目的创建者，Doug Cutting解释Hadoop的得名

：“这个名字是我孩子给一个棕黄色的大象玩具命名的。我的命名标准就是简短，容易发音和拼写，没有太多的意义，并且不会被用于别处。小孩子恰恰是这方面的高手

扩展资料

Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点：

1.高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。

2.高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。

3.高效性。Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。

4.高容错性。Hadoop能够自动保存数据的多个副本，并且能够自动将失败的任务重新分配[4] 。

5.低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比，hadoop是开源的，项目的软件成本因此会大大降低。

参考资料来源：百度百科-Hadoop

上一篇: hadoop是什么意思？与大数据有什么关系？

下一篇: 什么是大数据?

Hadoop

文章来源：Web开发网，欢迎分享，转载请保留出处
原文地址：https://kaifa5.com/7106.html

阅读延展

ubuntu下hadoop的部署有哪些呢？

南京大数据hadoop网络培训，钜惠来袭！！！

大数据Spark技术是否可以替代Hadoop？

阿里云安全披露，有攻击者利用Hadoop Yarn资源管理系统REST API未授权访问漏洞进行攻击

搭建私有云平台：Hadoop还是选择OpenStack？

一文带你了解Hadoop3.x

评论列表暂无评论

发表评论取消回复: 好顶踩