Hadoop 单机安装
Hadoop 单机安装
Hadoop 启动模式
Hadoop 集群有三种启动模式:
- 单机模式:默认情况下运行为一个单独机器上的独立 Java 进程,主要用于调试环境
- 伪分布模式:在单个机器上模拟成分布式多节点环境,每一个 Hadoop 守护进程都作为一个独立的 Java 进程运行
- 完全分布式模式:真实的生产环境,搭建在完全分布式的集群环境
用户及用户组
需要添加用来运行Hadoop 进程的用户组 Hadoop 及用户 Hadoop
注意:没有linux 环境可以使用docker
可以使用下面的命令来查看已经创建好的 hadoop 用户和 uid 与 gid
1 | $ id hadoop |
另外在 /etc/passwd 文件中也记录了用户的信息,使用下面的命令查看:
1 | $ tail -5 /etc/passwd |
添加用户及用户组的步骤如下:
创建用户 Hadoop
1 | $ sudo adduser hadoop |
请按照提示输入 hadoop 用户的密码,例如密码设定为 hadoop 。
将 hadoop 用户添加进 sudo 用户组
1 | $ sudo usermod -G sudo hadoop |
安装及配置以来的软件包
Hadoop 的 运行需要JDK, 同时还应配置 SSH 免密码登录
关于配置Java的环境变量,请自行搜索教程
配置SSH免密码登录
切换到 hadoop 用户, hadoop 用户时密码为 hadoop。 后续步骤都将在 hadoop 用户的环境中执行。
1 | // 切换 hadoop 用户 |
配置 ssh 环境免密码登录。
在 /home/hadoop 目录下执行下面的命令
1 | // 切换到根目录 |
对于秘钥对的设置,保持迷人,等到执行完成后,秘钥对就生成好了(一般存放于 ~/.ssh/ 目录中)
1 | // 将公钥写入验证文件中 |
验证登录本机是否还需要密码,第一次需要密码以后不需要密码就可以登录
1 | // 仅需输入一次 hadoop 密码, 以后不需要输入 |
下载并安装 Hadoop
注意,本部分的操作都是在 hadoop 用户登录的环境中进行的。
切换用户使用下面的命令。
1 | // 切换为 hadoop 用户 |
下载 Hadoop 2.6.0
本次演示为 hadoop 2.6.0 学习者可以安装其他版本 具体安装步骤请参考官网
Hadoop 的下载比较缓慢,为了方便大家下载,推荐大家搜索如何 使用 阿里云的镜像
1 | // 进入家目录 /home/hadoop |
解压并安装
1 | $ tar zxvf hadoop-2.6.0.tar.gz |
请耐心等待解压完成
安装之前还需要删除之前的遗留文件,如果出现无此文件夹的提示, 说明没有遗留文件。
1 | // 删除原本遗留的 hdfs 文件夹 |
然后再进行安装工作。
1 | // 复制所需文件 |
配置 Hadoop
1 | $ vim /home/hadoop/.bashrc |
在 /home/hadoop/.bashrc 文件末尾添加下列内容:
下面配置中 以 # 开头的是注释,无需输入
1 | #HADOOP START |
在 /home/hadoop/.bashrc 文件中 PATH 路径更改 HADOOP 相关内容:
1 | export PATH=/usr/local/sbin:/usr/local/bin/:/usr/bin:/usr/sbin:/sbin:/bin:/home/hadoop/hdfs/bin:/home/hadoop/hdfs/sbin |
保存退出后,激活新加的环境变量
1 | $ source ~/.bashrc |
至此,Hadoop 单机模式安装完成,可以通过下述步骤的测试来验证安装是否成功。
验证测试
创建输入的数据,暂时采用 /etc/protocols 文件作为测试
1 | # 进入到 Hadoop 的目录 |
执行 Hadoop WordCount 应用(词频统计)
1 | $ hadoop jar \ |