hadoop集群安装心得（手把手搭建hadoop集群）

一、免密登录1、生成秘钥

有三台服务器举例子比如 flinka flinkb flinkc

举个例子，在flinkc上生成密码

ssh-keygen -t rsa

2、把公钥发给flinkb flinc flina 是的，自身也要设置免密

ssh-copy-id flinkb

hadoop集群安装心得（手把手搭建hadoop集群）(1)

3、测试是否设置成功

ssh flinka ssh flinkb ssh flinkc

hadoop集群安装心得（手把手搭建hadoop集群）(2)

hadoop集群安装心得（手把手搭建hadoop集群）(3)

hadoop集群安装心得（手把手搭建hadoop集群）(4)

都不用设置密码的，就可以登录！！

在flinkb flinka另外两台服务器上也这样设置

hadoop集群安装心得（手把手搭建hadoop集群）(5)

hadoop集群安装心得（手把手搭建hadoop集群）(6)

到这里免密登录结束

二、解压hadoop安装包，重命名为hadoop-3.3.0文件夹

hadoop集群安装心得（手把手搭建hadoop集群）(7)

1、配置core-site.xml

<configuration>  <property> <name>fs.defaultFS</name> <value>hdfs://ns</value> </property>  <property> <name>hadoop.tmp.dir</name> <value>/root/hadoop-3.3.0/tmp</value> </property> <property> <name>ha.Zookeeper.quorum</name> <value>flinka:2181,flinkb:2181,flinkc:2181</value> </property> </configuration>

2、配置hdfs-site.xml文件

<configuration> <property> <name>dfs.replication</name> <value>3</value> </property> <property> <name>dfs.nameservices</name> <value>ns</value> </property> <property> <name>dfs.ha.namenodes.ns</name> <value>nn1,nn2,nn3</value> </property> <property> <name>dfs.namenode.rpc-address.ns.nn1</name> <value>flinka:8020</value> </property> <property> <name>dfs.namenode.http-address.ns.nn1</name> <value>flinka:9870</value> </property> <property> <name>dfs.namenode.rpc-address.ns.nn2</name> <value>flinkb:8020</value> </property> <property> <name>dfs.namenode.http-address.ns.nn2</name> <value>flinkb:9870</value> </property> <property> <name>dfs.namenode.rpc-address.ns.nn3</name> <value>flinkc:8020</value> </property> <property> <name>dfs.namenode.http-address.ns.nn3</name> <value>flinkc:9870</value> </property> <property> <name>dfs.namenode.shared.edits.dir</name> <value>qjournal://flinka:8485;flinkb:8485;flinkc:8485/ns</value> </property> <property> <name>dfs.journalnode.edits.dir</name> <value>/root/hadoop-3.3.0/journal/data</value> </property> <property> <name>dfs.ha.automatic-failover.enabled</name> <value>true</value> </property> <property> <name>dfs.client.failover.proxy.provider.ns</name> <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> </property> <property> <name>dfs.ha.fencing.methods</name> <value>sshfence</value> <value>shell(true)</value> </value> </property>  <property> <name>dfs.ha.fencing.ssh.private-key-files</name> <value>/root/.ssh/id_rsa</value> </property>  <property> <name>dfs.ha.fencing.ssh.connect-timeout</name> <value>30000</value> </property> </configuration>

3、配置yarn-site.xml文件

<configuration>  <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property>  <property> <name>yarn.resourcemanager.ha.enabled</name> <value>true</value> </property>  <property> <name>yarn.resourcemanager.cluster-id</name> <value>mycluster</value> </property>  <property> <name>yarn.resourcemanager.ha.rm-ids</name> <value>rm1,rm2,rm3</value> </property>  <property> <name>yarn.resourcemanager.hostname.rm1</name> <value>flinka</value> </property>  <property> <name>yarn.resourcemanager.hostname.rm2</name> <value>flinkb</value> </property>  <property> <name>yarn.resourcemanager.hostname.rm3</name> <value>flinkc</value> </property>  <property> <name>yarn.resourcemanager.address.rm1</name> <value>flinka:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address.rm1</name> <value>flinka:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address.rm1</name> <value>flinka:8031</value> </property> <property> <name>yarn.resourcemanager.admin.address.rm1</name> <value>flinka:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address.rm1</name> <value>flinka:8088</value> </property>  <property> <name>yarn.resourcemanager.address.rm2</name> <value>flinkb:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address.rm2</name> <value>flinkb:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address.rm2</name> <value>flinkb:8031</value> </property> <property> <name>yarn.resourcemanager.admin.address.rm2</name> <value>flinkb:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address.rm2</name> <value>flinkb:8088</value> </property>  <property> <name>yarn.resourcemanager.address.rm3</name> <value>flinkc:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address.rm3</name> <value>flinkc:8030</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address.rm3</name> <value>flinkc:8031</value> </property> <property> <name>yarn.resourcemanager.admin.address.rm3</name> <value>flinkc:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address.rm3</name> <value>flinkc:8088</value> </property>  <property> <name>yarn.resourcemanager.recovery.enabled</name> <value>true</value> </property> <property> <name>yarn.resourcemanager.store.class</name> <value>org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore</value> </property>  <property> <name>yarn.resourcemanager.zk-address</name> <value>flinka:2181,flinkb:2181,flinkc:2181</value> </property>  <property> <name>yarn.resourcemanager.ha.automatic-failover.enabled</name> <value>true</value> </property> <property> <name>yarn.client.failover-proxy-provider</name> <value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value> </property>  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property>  <property> <name>yarn.resourcemanager.connect.retry-interval.ms</name> <value>2000</value> </property>  <property> <name>yarn.nodemanager.pmem-check-enabled</name> <value>false</value> </property> <property> <name>yarn.nodemanager.vmem-check-enabled</name> <value>false</value> </property> <property> <name>yarn.scheduler.minimum-allocation-mb</name> <value>100</value> </property> <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>16384</value> </property> </configuration>

3、启动Zookeeper

zkServer.sh start

zkServer.sh status

4、启动journalnode服务

4.1、在三台服务器上运行

hdfs --daemon start journalnode

4.2、在主节点flinka上

hdfs namenode -format

启动namenode

hdfs --daemon start namenode

4.3、在其他的节点上同步namenode并且启动namenode

hdfs namenode -bootstrapStandby