Skip to main content
 Web开发网 » 操作系统 » linux系统

hadoop到底是什么?

2021年10月14日6020百度已收录

Hadoop细分的话包含两部分,一部分是HDFS,这个是分布式文件系统,包含NameNode和DataNode,用于存储pb级数据,特点就是大,可以部署到上前台上万台机器上,用于存储。 还有一个部分是MapReduce,这个是一个计算框架,用于离线分析数据,还有一个Yarn,这个是Rarn可以说是一个资源管理类和任务调度器,用于管理和调度程序,包括MapReduce但又不限于MapReduce,也可以运行Spark等。

下面就是生态圈了,hadoop生态圈还包含spark,flume,hbase,kakfa等等

评论列表暂无评论
发表评论
微信