我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Hadoop完全分布式集群搭建(超详细)

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Hadoop完全分布式集群搭建(超详细)

目录

1.1.1 完全分布式介绍

1.1.2 平台软件说明

1.1.3 守护进程布局

1.2.1 集群搭建准备

1.2.2 总纲

1.2.3防火墙关闭

1.2.4 主机映射

1.2.5 免密登陆

1.2.6 jdk安装和hadoop安装及环境配置

1.3.1 配置文件

1.core-site.xml

2.hdfs-site.xml

3.hadoop-enc.sh

4.workres

5. 分发

1.3.2 格式化集群

1.3.2 启动集群

1.3.3 进程查看

1.4.1 YARN配置

1.mapred-site.xml

2.yarn-site.xml

3.hadoop-env.sh

1.4.2 分发到其他节点


java安装包和hadoop安装包还是用上次的jdk-8u191-linux-x64.tar.gz和hadoop-3.1.1.tar.gz

1.1.1 完全分布式介绍

    在真实的企业环境中,服务器集群会使⽤到多台机器,共同配合,来构建⼀个完整的分布式⽂件系统。⽽在这样的分布式⽂件系统中,HDFS相关的守护进程也会分布在不同的机器上,例如:

  • NameNode守护进程,尽可能的单独部署在⼀台硬件性能较好的机器中。
  • 其他的每台机器上都会部署⼀个DataNode守护进程,⼀般的硬件环境即可。
  • SecondaryNameNode守护进程最好不要和NameNode在同⼀台机器上。

1.1.2 平台软件说明

平台&&软件说明
宿主操作系统Windows
虚拟机操作系统Centos7
虚拟机软件 VMWare
虚拟机 主机名: shulin1, IP地址: 192.168.10.101 主机名: shulin2, IP地址: 192.168.10.102 主机名: shulin3, IP地址: 192.168.10.103
SSH工具xshll/xftp
软件包上传路径 /usr/local
软件安装路径 /usr/local
JDK X64: jdk-8u191-linux-x64.tar.gz
Hadoop X64: hadoop-3.1.1.tar.gz
⽤户 root

1.1.3 守护进程布局

NamenodeDatenode SecondaryNameNode
shulin1        √     √
shulin2     √                  √

shulin3

     √ 

1.2.1 集群搭建准备

1.2.2 总纲

  1. 三台机器的防⽕墙必须是关闭的.
  2. 确保三台机器的⽹络配置畅通(NAT模式,静态IP,主机名的配置)
  3. 确保/etc/hosts⽂件配置了ip和hostname的映射关系
  4. 确保配置了三台机器的免密登陆认证(克隆会更加⽅便)
  5. 确保所有机器时间同步
  6. jdk和hadoop的环境变量配置

1.2.3防火墙关闭

三台虚拟机都要关闭[root@shulin ~]# systemctl stop firewalld   #正常情况执行前两步即可,不懂的可以百度一下[root@shulin ~]# systemctl disable firewalld[root@shulin ~]# systemctl stop NetworkManager[root@shulin ~]# systemctl disable NetworkManager#最好也把selinux关闭掉,这是linux系统的⼀个安全机制,进⼊⽂件中将SELINUX设置为disabled[root@shulin ~]# vi /etc/selinux/config.........SELINUX=disabled .........

1.2.4 主机映射

三台虚拟机均要配置[root@shulin1 ~]# vi /etc/hosts127.0.0.1 localhost localhost.localdomain localhost4 localhost4.localdomain4::1 localhost localhost.localdomain localhost6 localhost6.localdomain6192.168.10.101 shulin1 #添加本机的静态IP和本机的主机名之间的映射关系192.168.10.102 shulin2192.168.10.103 shulin3

1.2.5 免密登陆

三台虚拟机均要配置# 1. 使⽤rsa加密技术,⽣成公钥和私钥。⼀路回⻋即可[root@shulin1 ~]# ssh-keygen -t rsa # 2. 使⽤ssh-copy-id命令[root@shulin1 /]#cd ~/.ssh [root@shulin1 .ssh]# ssh-copy-id root@shulin1[root@shulin1 .ssh]# ssh-copy-id root@shulin2[root@shulin1 .ssh]# ssh-copy-id root@shulin3# 3. 进⾏验证 [hadoop@shulin1 .ssh]# ssh shulin1[hadoop@shulin1 .ssh]# ssh shulin2[hadoop@shulin1 .ssh]# ssh shulin3# 4. 继续在shulin2和shulin3⽣成公钥和私钥,给三台节点拷⻉。

1.2.6 jdk安装和hadoop安装及环境配置

这一步只配置第一台即可,另外两台直接传过去即可。

请参考hadoop安装之保姆级教程 1.1.1节至1.2.1节的java和hadoop安装及其环境配置。

1.3.1 配置文件

配置文件地址在 usr/local/hadoop-3.1.1/etc/hadoop 下

1.core-site.xml

            fs.defaultFS        hdfs://shulin1:9820                hadoop.tmp.dir        /usr/local/hadoop-3.1.1/tmp    

2.hdfs-site.xml

            dfs.replication    3                dfs.namenode.secondary.http-address        shulin2:9868                dfs.namenode.http-address        shulin1:9870    

3.hadoop-env.sh

export JAVA_HOME=/usr/local/jdk1.8.0_191# Hadoop3中,需要添加如下配置,设置启动集群⻆⾊的⽤户是谁export HDFS_NAMENODE_USER=rootexport HDFS_DATANODE_USER=rootexport HDFS_SECONDARYNAMENODE_USER=root

4.workers

将原来的localhost删掉,改为shulin1shulin2shulin3

5. 分发

# 我们已经完成了⼀个节点的环境配置,其他的节点也需要保持完全相同的配置。我们只需要将shulin1节点的配置拷⻉到其他的节点即可。# 分发之前,先检查⾃⼰的节点数据⽂件是否存在# 如果之间格式化过集群,那么会在core-site.xml中配置的hadoop.tmp.dir路径下⽣成⽂件,先将其删除[root@shulin1 ~]# cd /usr/local[root@shulin1 local]# scp -r jdk1.8.0_321/ shulin2:$PWD[root@shulin1 local]# scp -r jdk1.8.0_321/ shulin3:$PWD[root@shulin1 local]# scp -r hadoop-3.3.1/ shulin2:$PWD[root@shulin1 local]# scp -r hadoop-3.3.1/ shulin3:$PWD[root@shulin1 local]# scp etc/profile shulin2:/etc/[root@shulin1 local]# scp etc/profile shulin2:/etc/

1.3.2 格式化集群

我们只在1号机格式就可以[root@shulin1 ~]# hdfs namenode -format

1.3.2 启动集群

start-dfs.sh # 启动HDFS所有进程(NameNode、SecondaryNameNode、DataNode)stop-dfs.sh # 停⽌HDFS所有进程(NameNode、SecondaryNameNode、DataNode)# hdfs --daemon start 单独启动⼀个进程hdfs --daemon start namenode # 只开启NameNodehdfs --daemon start secondarynamenode # 只开启SecondaryNameNodehdfs --daemon start datanode # 只开启DataNode# hdfs --daemon stop 单独停⽌⼀个进程hdfs --daemon stop namenode # 只停⽌NameNodehdfs --daemon stop secondarynamenode # 只停⽌SecondaryNameNodehdfs --daemon stop datanode # 只停⽌DataNode# hdfs --workers --daemon start 启动所有的指定进程hdfs --workers --daemon start datanode # 开启所有节点上的DataNode# hdfs --workers --daemon stop 启动所有的指定进程hdfs --workers --daemon stop datanode # 停⽌所有节点上的DataNode

1.3.3 进程查看

# shulin1节点[root@shulin1 hadoop]# jps13442 NameNode13618 DataNode13868 Jps# shulin2节点[root@shulin2 ~]# jps10514 SecondaryNameNode10548 Jps10405 DataNode# shulin3节点[root@shulin3 ~]# jps10931 DataNode11001 Jps

1.4.1 YARN配置

1.mapred-site.xml

            mapreduce.framework.name        yarn                yarn.app.mapreduce.am.env        HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.1                  mapreduce.map.env        HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.1                mapreduce.reduce.env        HADOOP_MAPRED_HOME=/usr/local/hadoop-3.1.1    

2.yarn-site.xml

            yarn.resourcemanager.hostname        shulin1                               yarn.nodemanager.aux-services        mapreduce_shuffle    

3.hadoop-env.sh

# 在最后面添加如下:export YARN_RESOURCEMANAGER_USER=rootexport YARN_NODEMANAGER_USER=root

1.4.2 分发到其他节点

[root@shulin ~]# cd $HADOOP_HOME/etc/ [root@shulin etc]# scp -r hadoop shulin02:$PWD[root@shulin etc]# scp -r hadoop shulin03:$PWD

1.5.1 配置完成

至此hadoop完全分布式集群以搭建完成,可以打开火狐浏览器输入对应ip地址和端口号即可查看hadoop页面和yarn页面

来源地址:https://blog.csdn.net/qq_52868045/article/details/127981884

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Hadoop完全分布式集群搭建(超详细)

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Hadoop完全分布式集群搭建

Hadoop的运行模式Hadoop一般有三种运行模式,分别是:单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统。,用于开发和调试。伪分布式模式(Pseudo Distrubuted Mod
Hadoop完全分布式集群搭建
2021-07-05

CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境

这篇文章将为大家详细讲解有关CentOS 7如何搭建Hadoop 2.7.3完全分布式集群环境,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。(一)软件准备1,hadoop-2.7.3.tar.gz(包)2
2023-06-03

Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的

这期内容当中小编将会给大家带来有关Apache Hadoop 2.8 完全分布式集群搭建过程是怎样的,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。最近在自己的笔记本电脑上搭建了Apache Hadoop分
2023-06-19

如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群

本篇内容主要讲解“如何使用Centos7系统搭建Hadoop-3.1.4完全分布式集群”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“如何使用Centos7系统搭建Hadoop-3.1.4完全分布
2023-06-15

hadoop完全分布式怎么搭建

要搭建Hadoop完全分布式集群,需要按照以下步骤进行操作:准备环境:首先需要准备多台服务器,至少需要3台以上的服务器来搭建Hadoop集群。每台服务器需要安装Linux操作系统(推荐使用CentOS或Ubuntu),并且要保证服务器之间能
hadoop完全分布式怎么搭建
2024-03-13

CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群

这篇文章主要介绍了CentOS 6.4如何安装Hadoop-2.5.1完全分布式集群,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。环境介绍:在两台装有CentOS 6.4(3
2023-06-03

Zookeeper分布式集群搭建

文中Zookeeper分布式集群搭建在Linux CentOS7系统之上。搭建大数据分布式集群,不建议使用root用户直接操作,故文中使用bigdata用户进行集群的搭建。一、环境准备软件版本Linux系统CentOS7JDKjdk-8u221-linux-x
2015-10-26

完全分布式hadoop搭建的步骤是什么

搭建完全分布式Hadoop集群通常包括以下步骤:准备环境:确保所有节点都有相同的操作系统和Java版本,并且具有网络互通的能力。安装Hadoop软件:在每个节点上下载并安装Hadoop软件包。配置Hadoop集群:编辑Hadoop配置文件,
完全分布式hadoop搭建的步骤是什么
2024-03-05

ubantu 16.4下Hadoop完全分布式搭建实战教程

前言 本文主要介绍了关于ubantu 16.4 Hadoop完全分布式搭建的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧 一个虚拟机 1.以 NAT网卡模式 装载虚拟机2.最好将几个用到的虚拟机修改主机名
2022-06-04

mysql分布式集群怎么搭建

要搭建一个 MySQL 分布式集群,可以采用以下步骤:选择合适的分布式架构:MySQL 分布式集群可以采用主从复制、主从同步复制、主从多从复制等不同的架构方式。根据实际需求和性能要求,选择合适的分布式架构。部署数据库节点:在不同的服务器上
mysql分布式集群怎么搭建
2024-04-18

Hadoop单机版和全分布式(集群)安装

Hadoop,分布式的大数据存储和计算, 免费开源!有Linux基础的同学安装起来比较顺风顺水,写几个配置文件就可以启动了,本人菜鸟,所以写的比较详细。为了方便,本人使用三台的虚拟机系统是Ubuntu-12。设置虚拟机的网络连接使用桥接方式
2022-06-04

Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建

这篇文章主要介绍“Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建”,在日常操作中,相信很多人在Hadoop2.7.5+Spark2.2.1分布式集群怎么搭建问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对
2023-06-03

Centos7.3 RabbitMQ分布式集群搭建示例

本文介绍了Centos7.3 RabbitMQ分布式集群搭建示例,分享给大家,具体如下:注意事项 centos 7.x 关闭firewall 三台机器:172.17.250.97 rabbiMQ01 172.17.250.98 ra
2022-06-04

windows怎么搭建Redis分布式集群

要搭建Redis分布式集群,您可以按照以下步骤进行操作:1. 下载Redis的稳定版本,并解压到不同的目录,例如:redis1、redis2、redis3。2. 分别进入redis1、redis2、redis3目录,并分别编辑redis.c
2023-09-11

编程热搜

  • Android:VolumeShaper
    VolumeShaper(支持版本改一下,minsdkversion:26,android8.0(api26)进一步学习对声音的编辑,可以让音频的声音有变化的播放 VolumeShaper.Configuration的三个参数 durati
    Android:VolumeShaper
  • Android崩溃异常捕获方法
    开发中最让人头疼的是应用突然爆炸,然后跳回到桌面。而且我们常常不知道这种状况会何时出现,在应用调试阶段还好,还可以通过调试工具的日志查看错误出现在哪里。但平时使用的时候给你闹崩溃,那你就欲哭无泪了。 那么今天主要讲一下如何去捕捉系统出现的U
    Android崩溃异常捕获方法
  • android开发教程之获取power_profile.xml文件的方法(android运行时能耗值)
    系统的设置–>电池–>使用情况中,统计的能耗的使用情况也是以power_profile.xml的value作为基础参数的1、我的手机中power_profile.xml的内容: HTC t328w代码如下:
    android开发教程之获取power_profile.xml文件的方法(android运行时能耗值)
  • Android SQLite数据库基本操作方法
    程序的最主要的功能在于对数据进行操作,通过对数据进行操作来实现某个功能。而数据库就是很重要的一个方面的,Android中内置了小巧轻便,功能却很强的一个数据库–SQLite数据库。那么就来看一下在Android程序中怎么去操作SQLite数
    Android SQLite数据库基本操作方法
  • ubuntu21.04怎么创建桌面快捷图标?ubuntu软件放到桌面的技巧
    工作的时候为了方便直接打开编辑文件,一些常用的软件或者文件我们会放在桌面,但是在ubuntu20.04下直接直接拖拽文件到桌面根本没有效果,在进入桌面后发现软件列表中的软件只能收藏到面板,无法复制到桌面使用,不知道为什么会这样,似乎并不是很
    ubuntu21.04怎么创建桌面快捷图标?ubuntu软件放到桌面的技巧
  • android获取当前手机号示例程序
    代码如下: public String getLocalNumber() { TelephonyManager tManager =
    android获取当前手机号示例程序
  • Android音视频开发(三)TextureView
    简介 TextureView与SurfaceView类似,可用于显示视频或OpenGL场景。 与SurfaceView的区别 SurfaceView不能使用变换和缩放等操作,不能叠加(Overlay)两个SurfaceView。 Textu
    Android音视频开发(三)TextureView
  • android获取屏幕高度和宽度的实现方法
    本文实例讲述了android获取屏幕高度和宽度的实现方法。分享给大家供大家参考。具体分析如下: 我们需要获取Android手机或Pad的屏幕的物理尺寸,以便于界面的设计或是其他功能的实现。下面就介绍讲一讲如何获取屏幕的物理尺寸 下面的代码即
    android获取屏幕高度和宽度的实现方法
  • Android自定义popupwindow实例代码
    先来看看效果图:一、布局
  • Android第一次实验
    一、实验原理 1.1实验目标 编程实现用户名与密码的存储与调用。 1.2实验要求 设计用户登录界面、登录成功界面、用户注册界面,用户注册时,将其用户名、密码保存到SharedPreference中,登录时输入用户名、密码,读取SharedP
    Android第一次实验

目录