根据官网快速安装hadoop

技术2022-07-10 397

环境准备

一个纯净版的centos7 虚拟机，配置好静态ip，主机名，主机映射

配置静态ip

vi /etc/sysconfig/network-scripts/ifcfg-ens33 ----------------------------------------------------- TYPE=Ethernet PROXY_METHOD=none BROWSER_ONLY=no BOOTPROTO=static DEFROUTE=yes IPV4_FAILURE_FATAL=no IPV6INIT=yes IPV6_AUTOCONF=yes IPV6_DEFROUTE=yes IPV6_FAILURE_FATAL=no IPV6_ADDR_GEN_MODE=stable-privacy NAME=ens33 UUID=e219cc60-b53f-4563-a91c-5239fc9103a8 DEVICE=ens33 ONBOOT=yes IPADDR=192.168.73.101

更改主机名

立即生效

hostnamectl set-hostname hadoop1

配置主机映射

vi /etc/hosts ----------------------------------------------------- 192.168.191.101 hadoop1

在/opt下创建两个文件夹，software，install

cd /opt mkdir software install

免密登陆

ssh-keygen #3次回车 #拷贝密钥 ssh-copy-id hadoop1

安装jdk

#解压 tar zxvf jdk-8u171-linux-x64.tar.gz -C /opt/install/ #配置环境变量 vi /etc/profile export JAVA_HOME=/opt/install/jdk1.8.0_221 export JRE_HOME=/opt/install/jdk1.8.0_221/jre export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin #刷新环境变量 source /etc/profile #验证输入 java -version #显示结果 java version "1.8.0_221" Java(TM) SE Runtime Environment (build 1.8.0_221-b11) Java HotSpot(TM) 64-Bit Server VM (build 25.221-b11, mixed mode)

安装Hadoop

Hadoop 的安装模式分为3种：单机（本地）模式，伪分布式，完全分布式（集群模式）

本地模式安装

解压

tar zxvf hadoop-2.6.0-cdh5.14.2.tar.gz -C /opt/install/

环境变量

vi /etc/profile --------------------------- # hadoop export HADOOP_HOME=/opt/install/hadoop-2.6.0-cdh5.14.2 export PATH=$HADOOP_HOME/bin:$PATH --------------------------------- source /etc/profile

测试

bin/hadoop

官方示例演示

mkdir input cp etc/hadoop/*.xml input bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.14.2.jar grep input output 'dfs[a-z.]+' cat output/*

伪分布式搭建

修改HDFS配置文件

etc/hadoop/hadoop-env.sh

export JAVA_HOME=/opt/install/jdk1.8.0_221

etc/hadoop/core-site.xml

<property> <name>fs.defaultFS</name> <value>hdfs://hadoop1:9000</value> </property>

etc/hadoop/hdfs-site.xml

<property> <name>dfs.replication</name> <value>1</value> </property>

etc/hadoop/slaves

hadoop1

格式化文件系统

bin/hdfs namenode -format

启动HDFS

sbin/start-dfs.sh

验证是否成功

#输入命令 jps #显示结果 20896 Jps 20787 SecondaryNameNode 20521 NameNode 20638 DataNode

使用web浏览器访问50070端口，查看是否能打开

官方示例演示

hdfs dfs -mkdir /input hdfs dfs -put etc/hadoop/*.xml /input bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.14.2.jar grep /input /output 'dfs[a-z.]+' hdfs dfs -cat /output/part-r-00000

修改Yarn配置

mapred-site.xml

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml -------------------------- <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>

yarn-site.xml

<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>

启动Yarn

sbin/start-yarn.sh

查看jps进程

jps 22304 ResourceManager 21989 DataNode 22389 NodeManager 21868 NameNode 22143 SecondaryNameNode 22703 Jps

使用web浏览器访问8088端口，查看是否能打开

官方示例演示

hdfs dfs -rm -r -f /output bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0-cdh5.14.2.jar grep /input /output 'dfs[a-z.]+' hdfs dfs -cat /output/part-r-00000

Processed: 0.013, SQL: 9