Hadoop细分的话包含两部分,一部分是HDFS,这个是分布式文件系统,包含NameNode和DataNode,用于存储pb级数据,特点就是大,可以部署到上前台上万台机器上,用于存储。 还有一个部分是MapReduce,这个是一个计算框架,用于离线分析数据,还有一个Yarn,这个是Rarn可以说是一个资源管理类和任务调度器,用于管理和调度程序,包括MapReduce但又不限于MapReduce,也可以运行Spark等。
下面就是生态圈了,hadoop生态圈还包含spark,flume,hbase,kakfa等等