我的编程空间,编程开发者的网络收藏夹
学习永远不晚

初识Hadoop的三种安装模式

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

初识Hadoop的三种安装模式

初识Hadoop的三种安装模式

特点:高可靠性(不怕丢)、高效性(处理速度快)、高容错性

  • ps:使用Hadoop版本:

接下来所用到的Hadoop2.8.5,虽然目前Hadoop已经更新到3.x了;但是我们始终秉持一个观点“用旧不用新”,因为毕竟旧版本较为稳定(目前虽然jdk出到版本为16了,但是我们还是会使用jdk8和jdk11),包括后期使用的各项Hive、Hbase等都需要与hadoop版本相对应,很难去找此类资源;当然如果到公司以后,公司也会给你提供好相应版本的,直接用就可以。

Hadoop

HDFS:分布式文件系统---需要安装

MapReduce:分布式离线计算框架----不需要安装----逻辑概念-----需要编码实现

Yarn:分布式资源调度系统----需要安装

安装方式:

  • 本地模式
  • 伪分布式模式---一台电脑
  • 完全分布式

1.本地模式配置

(本模式下:hdfs和yarn组件无法使用,只能使用mapreduce-----一般只用来测试mapreduce)

一般会将目录设置为(/opt目录一般存放第三方软件)---app下放安装的软件,software下放第三方软件的压缩包

image-20210727125043807

  • 解压hadoop压缩包至/opt/app目录下

img

  • vim /etc/profile来更改系统环境变量(配置Hadoop的环境变量:目的是为了能够在任何目录下都能使用hadoop命令)

    export HADOOP_HOME=/opt/app/hadoop-2.8.5
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    
  • source /etc/profile
    hadoop version
    

    image-20210727130049405

2.伪分布式模式

(本模式下:hadoop的组件hdfs和yarn都在一台机器上,需要去修改配置文件)

前言:一个巨大的文件需要进行存储,单台计算机肯定是不能存储这个文件的,因此我们可以将这个文件切割成几个部分,分别放到不同计算机上。但是这时出现了一个问题:三台机器上存储的文件互相没有联系,大文件怎么能下载呢? 此时可以在每个电脑上安装HDFS进行 “关系定义”,接下来讨论下这个关键性技术HDFS

主从模式--分布式软件:一个主节点,多个从节点

  • 熟悉概念

    • HDFS{

      ​ NameNode:存储元数据{领导,知道数据放到哪里}

      ​ DataNode:存储数据(员工)

      ​ SecondaryNameNode:(秘书)

      }

    • Yarn{
      ​ ResourceManager (相当于NameNode:领导)

      ​ NodeManager (相当于DataNode:员工)

      }

  • 配置项

    image-20210727144804823

(.sh文件进行与java相连的jdk配置:配置JAVA_HOME=/opt/app/jdk1.8)

(.xml文件进行相应配置:core(common公共的)、hdfs、mapred、yarn)

1.core-site.xml


  hadoop.tmp.dir
  /opt/app/hadoop-2.8.5/temp

2.hdfs-site.xml


  fs.defaultFS
  hdfs://192.168.0.20:9000



  dfs.replication
  1

3.mapred-site.xml


  mapreduce.framework.name
  yarn

4.yarn-site.xml


  yarn.nodemanager.aux-services
  mapreduce_shuffle




  yarn.resourcemanager.hostname
  192.168.0.20

  • 格式化NameNode

    (相当于创建core-site.xml中声明的temp目录)

    {只能格式化1次,如果非要格式化的话,那么可以将产生的temp文件删除}

hadoop namenode -format
  • 开启hdfs服务和yarn服务

    start-dfs.sh
    start-yarn.sh
    
  • 访问验证

    namenode访问网址{http://ip:50070}
    yarn的访问网址{http://ip:8088}
    

    image-20210727155107899

    image-20210727154950966

  • 补充

    通过此种方式,你会发现在启动各个节点时需要反复输入密码,不想要这样的话,就寻找解决方式:

    配置SSH免密钥登录

    生成密钥

    cd ~/.ssh
    ssh-keygen -t rsa
    

    image-20210727162643922

    把密码给别人

    ssh-copy-id 192.168.0.20
    

    image-20210727162918257

3.完全分布式

(最少有3台节点组成的集群)----一般在生产部署时使用

1.需要准备3台虚拟机:通过克隆(创建完整克隆)方式创建

image-20210727173527054

2.配置3台虚拟机的静态网络

192.168.0.20 、192.168.0.21、192.168.0.22

3.配置3台虚拟机的免密登录

---过程与伪分布式中所谈到的免密登录一致

(成功界面)

image-20210727220159195

4.同步时间

  • 安装ntp

    yum install -y ntp
    vim /etc/ntp.conf
    

    image-20210727222237091

此处第一个圆圈内,我的网段应该为192.168.0.0

image-20210727222538832

(以上两张图片为需要在ntp.conf中修改和添加的)

  • 修改/etc/sysconfig/ntpd

    添加代码
    SYNC_HWCLOCK=yes
    
  • 添加成开机启动

    systemctl enable ntpd
    

然后在node2和node3上配置定时任务

crontab -e
*/1 * * * * /usr/sbin/ntpdate 192.168.0.20
每隔1分钟,同步node1主服务器上的时间

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

初识Hadoop的三种安装模式

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

初识Hadoop的三种安装模式

特点:高可靠性(不怕丢)、高效性(处理速度快)、高容错性ps:使用Hadoop版本:接下来所用到的Hadoop2.8.5,虽然目前Hadoop已经更新到3.x了;但是我们始终秉持一个观点“用旧不用新”,因为毕竟旧版本较为稳定(目前虽然jdk出到版本为16了,但
初识Hadoop的三种安装模式
2021-06-16

MAC安装git的三种方式

MAC安装git的三种方式 方式一:使用Homebrew安装方式二:从官方网站下载安装包方式三:使用Xcode Command Line Tools安装总结 在MAC上安装Git有多种方式,包括通过Homebrew、下载安装包等
2023-08-25

docker的三种安装方式汇总

这篇文章主要介绍了docker的三种安装方式汇总,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-03-09

ubuntu21.04怎么安装软件?ubuntu安装软件的三种方式

我们在ubuntu21.04中安装软件有多种方式,这里我们介绍其中的三种常用的安装方式,除了自带的apt还有应用相对比较新的,兼容比较好的安装方式,该怎么安装软件呢?下面我们就来看看详细的教程。方法一: 首先我们进入ubuntu系统桌面,输
2022-05-27

Ubuntu安装MySQL的三种方式以及卸载MySQL

目录一.卸载mysql输出第一列二.直接安装三.安装指定版本1.安装mysql-community-client相关2.安装mysql-community-server-core四.编译安装五、初始化mysql六、编辑简单配置文件七.启动M
Ubuntu安装MySQL的三种方式以及卸载MySQL
2024-10-10

进入Win7安全模式的三种方法分别是什么

这期内容当中小编将会给大家带来有关进入Win7安全模式的三种方法分别是什么,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。方法一、开机按F8键进入1、我们在重启或者电脑开机的时候,在进入Windows系统启
2023-06-05

Centos7下部署nginx(三种方式安装部署,图文结合超详细,适合初学者)

Centos7下部署nginx ngxin是什么 Nginx (engine x) 是一个高性能的HTTP和反向代理web服务器, Nginx是一款轻量级的Web 服务器/反向代理服务器及电子邮件(IMAP/POP3)代理服务器,在BSD-
2023-08-18

在Legacy BIOS与UEFI 两种模式安装Windows 8操作系统的方法

Win8系统相对于Win7系统在开机速度上有相当大的提升,这是因为Win8系统为了提升系统性能和对硬件的优化,加入了诸如开机引导及应用预缓存等技术。而其中的UEFI BIOS引导,则能使平台开机更智能,开机速度更快。对比采用传统BIOS引导
2022-06-04

编程热搜

目录