Hadoop是什么?
Hadoop就是一个大数据解决方案。它提供了一套分布式系统基础架构。核心内容包含 hdfs 和mapreduce。hadoop2.0 以后引入yarn。
hdfs 是提供数据存储服务的,mapreduce 是方便数据计算的。
1、hdfs 又对应 namenode 和 datanode. namenode 负责保存元数据的基本信息, datanode 直接存放数据本身;
2、mapreduce 对应 jobtracker 和 tasktracker. jobtracker 负责分发任务,tasktracker 负责执行具体任务;
3、对应到 master/slave 架构,namenode 和jobtracker 就应该对应到 master, datanode 和 tasktracker 就应该对应到slave。
--------------------------
小范带你看程序介绍:每天提供最实用的java工具,定期分享项目源码。我们的宗旨是:复制粘贴就能用,减少开发时间,让我们java程序员有更多的时间划水摸鱼,多一些时间做自己想做的事情。
,