云主机hadoop网络怎么设置 云计算环境下如何使用hadoop
  PD5PEUHobzP8 2023年11月24日 40 0


一、环境

本教程中使用两台阿里云服务器,其配置为单核CPU,2G内存,操作系统为CentOS 7.4。使用JDK1.8及Hadoop2.7.4进行安装。

 

二、配置服务器hostname

进入实例的基本信息页面,点击修改信息

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云

修改HostName,NameNode节点对应的HostName为master,DataNode节点对应的HostName为node1

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_02


 

三、修改hosts(最好使用内网IP)

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop2.7.4_03

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_04


四、SSH无密码登录

无论是集群还是单机模式都需要配置SSH无密码登录,而且该步骤不可以忽略。

 

利用ssh-keygen生成密钥,在生成的过程中一直按回车就可以。

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop2.7.4_05

加入到授权中

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_06

将id_rsa.pub拷贝到node1节点上(此时需要输入node1节点上root用户的密码)

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_云主机hadoop网络怎么设置_07

登录到node1节点,并将上一步拷贝的id_rsa.pub加入到授权中,步骤同上,即cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

登录到master,测试免密登录是否成功,若此时不需要输入node1的密码即可直接登录,说明配置成功。

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_08



五、JAVA安装

解压jdk压缩包到指定目录

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_09

配置环境变量

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_10

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_云主机hadoop网络怎么设置_11

使配置的环境变量生效

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云_12

使用java -version测试安装是否成功

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_13

注:在node1进行同样的安装

 

六、hadoop安装

解压到指定目录

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云_14

配置环境变量

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_15

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_16

使配置的环境变量生效

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop2.7.4_17

使用hadoop version测试安装是否成功

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_18

注:在node1上进行同样的安装

 

七、配置hadoop

切换目录

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop2.7.4_19

修改core-site.xml如下:

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_20

修改hdfs-site.xml如下:

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_21

将mapred-site.xml.template拷贝一份并命名为mapred-site.xml

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_22

修改mapred-site.xml如下:

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_云主机hadoop网络怎么设置_23

修改yarn-site.xml如下:

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_24

修改slaves如下:

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_25

修改hadoop-env.sh如下:

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_26

注:将上述的配置文件拷贝一份到node1对应的目录中

 

八、格式化hdfs

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云_27

成功后

 

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云_28


九、启动进程

进入到sbin目录,执行脚本

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_29

使用jps命名查看结果,结果中共包含5个进程:NameNode、DataNode、SecondaryNameNode、NodeManager、ResourceManager;

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_30

 

十、使用自动的wordcount进行测试

创建用户目录

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云_31

将要进行统计的文件(我这里是一个txt文件)拷贝到hdfs上

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_阿里云_32

执行自带的wordcount例子,并将结果输出到output2中(如果已经存在output2则会报错,使用hdfs dfs -rm -r filename删除即可)

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_完全分布式_33

通过浏览器访问master的8088端口即可查看执行进度(如果通过外网访问,则要配置阿里云的安全组规则)

 

云主机hadoop网络怎么设置 云计算环境下如何使用hadoop_hadoop_34



 





【版权声明】本文内容来自摩杜云社区用户原创、第三方投稿、转载,内容版权归原作者所有。本网站的目的在于传递更多信息,不拥有版权,亦不承担相应法律责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@moduyun.com

  1. 分享:
最后一次编辑于 2023年11月24日 0

暂无评论

PD5PEUHobzP8
最新推荐 更多

2024-05-31