我的编程空间,编程开发者的网络收藏夹
学习永远不晚

hadoop3.3集群搭建方法

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

hadoop3.3集群搭建方法

本篇内容介绍了“hadoop3.3集群搭建方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,其核心部件是HDFS与MapReduce

概念

  • HDFS 是一个分布式文件系统:引入存放文件元数据信息的服务器namenode和实际存放数据的服务器Datanode,对数据进行分布式储存和读取。 

  • MapReduce 是一个计算框架:MapReduce的核心思想是把计算任务分配给集群内的服务器里执行。通过对计算任务的拆分(Map计算/Reduce计算)再根据任务调度器(JobTracker)对任务进行分布式计算。

服务 fsimage:元数据镜像文件(文件系统的目录树。) edits:元数据的操作日志(针对文件系统做的修改操作记录) NameNode 处理客户端的读写请求;配置副本策略;保存HDFS的元数据信息,比如命名空间信息,块信息等。当它运行的时候,这些信息是存在内存(保存的fsimage+edits)中的。但是这些信息也可以持久化到磁盘上 SecondaryNameNode 是专门做NameNode 中edits 文件向fsimage 合并数据,然后再发给namenode,防止edits过大的一种解决方案 NodeManager管理一个YARN集群中的每一个节点。比如监视资源使用情况( CPU,内存,硬盘,网络),跟踪节点健康等。 ResourceManager是Yarn集群主控节点,负责协调和管理整个集群(所有NodeManager)的资源 DataNode:负责存储client发来的数据块block;执行数据块的读写操作。 热备份:b是a的热备份,如果a坏掉。那么b马上运行代替a的工作。 冷备份:b是a的冷备份,如果a坏掉。那么b不能马上代替a工作。但是b上存储a的一些信息,减少a坏掉之后的损失。

集群

环境:

  • centos7

  • jdk1.8.0_241 / hadoop-3.3

本文使用的3.3新版本搭建集群(一主两从)

192.168.41.128   server1192.168.41.129   server2192.168.41.130   server3
#禁用selinux/etc/selinux/config #配置免密登录 ssh-keygen  ssh-copy-id -i .ssh/id_rsa.pub root@server2 ssh-copy-id -i .ssh/id_rsa.pub root@server3
  1. 安装jdk 略..

  2. 下载解压: tar zxvf hadoop-3.3.0.tar.gz

  3. 配置 详细查阅:http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/ClusterSetup.html

#Administrators should use the etc/hadoop/hadoop-env.sh and optionally the etc/hadoop/mapred-env.sh and etc/hadoop/yarn-env.sh scripts to do site-specific customization of the Hadoop daemons’ process environment.官网原话,意思要指定JAVA_HOMEexport JAVA_HOME=/usr/java/jdk1.8.0_241-amd64#etc/hadoop/core-site.xml <configuration>  <property>    <name>fs.defaultFS</name>    <value>hdfs://server1:9000</value>  </property> <property>  <name>hadoop.tmp.dir</name>  <value>/opt/hadoop-3.3.0/tmp</value> </property> #etc/hadoop/hdfs-site.xml,指定数据的副本数,小于等于从节点数 <property>    <name>dfs.replication</name>    <value>2</value>  </property> <property>    <name>dfs.namenode.secondary.http-address</name>    <value>server1:50090</value>  </property>#etc/hadoop/yarn-site.xml,yarn配置资源管理器,提供统一的资源管理和调度<property>    <name>yarn.nodemanager.aux-services</name>    <value>mapreduce_shuffle</value>  </property> <property>    <name>yarn.resourcemanager.hostname</name>    <value>server1</value>  </property>#etc/hadoop/mapred-site.xml,mapreduce的执行引擎<configuration>  <property>    <name>mapreduce.framework.name</name>    <value>yarn</value>  </property></configuration>
  1. 初始化hdfs: bin/hdfs namenode -format

  2. 修改执行角色

#sbin/start-dfs.sh,sbin/stop-dfs.shHDFS_DATANODE_USER=rootHDFS_DATANODE_SECURE_USER=hdfsHDFS_NAMENODE_USER=rootHDFS_SECONDARYNAMENODE_USER=root#sbin/start-yarn.sh,sbin/stop-yarn.shYARN_RESOURCEMANAGER_USER=rootHADOOP_SECURE_DN_USER=yarnYARN_NODEMANAGER_USER=root
  1. 配置从节点 etc/hadoop/works,修改对应主机

  2. 启动 sbin/start-all.sh

  3. 访问 http://192.168.41.128:9870/ 即主机+端口可以访问显示如下说明成功了 hadoop3.3集群搭建方法

“hadoop3.3集群搭建方法”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站,小编将为大家输出更多高质量的实用文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

hadoop3.3集群搭建方法

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

hadoop3.3集群搭建方法

本篇内容介绍了“hadoop3.3集群搭建方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!分布式服务器集群上存储海量数据并运行分布式分析应
2023-06-19

Kubernetes集群的搭建方法

本篇内容主要讲解“Kubernetes集群的搭建方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Kubernetes集群的搭建方法”吧!0. 概要使用kubeadm搭建一个单节点kuberne
2023-06-19

搭建Redis集群的方法

这篇文章主要讲解了“搭建Redis集群的方法”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“搭建Redis集群的方法”吧!Redis集群是一个由多个主从节点群组成的分布式服务集群,它具有复制、
2023-06-27

linux集群的搭建方法

这篇文章主要介绍“linux集群的搭建方法”,在日常操作中,相信很多人在linux集群的搭建方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”linux集群的搭建方法”的疑惑有所帮助!接下来,请跟着小编一起来
2023-06-16

Spark集群搭建的方法

这篇文章主要介绍“Spark集群搭建的方法”,在日常操作中,相信很多人在Spark集群搭建的方法问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Spark集群搭建的方法”的疑惑有所帮助!接下来,请跟着小编一起来
2023-06-27

docker zookeeper集群搭建的方法

本篇内容主要讲解“docker zookeeper集群搭建的方法”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“docker zookeeper集群搭建的方法”吧!准备工具一、安装docker 二
2023-06-19

云服务器集群搭建方法

一、云服务器配置云服务器的配置是指在使用云服务器时需要具备的各种资源和服务,包括服务器硬件、操作系统、网络连接、存储空间、数据库、应用程序等。在搭建云服务器时,需要先选择适合自己的服务器硬件和操作系统,然后根据业务需求,配置好各种资源和服务。在选择服务器硬件时,需要考虑到服务器的配置、性能、稳定性、可扩展性等因素。在选
2023-10-27

集群搭建

1.  集群搭建之主从复制MySQL主从复制是一个异步的复制过程,主库发送更新事件到从库,从库读取更新记录,并执行更新记录,使得从库的内容与主库保持一致。1.1   主服务器的配置1.1.1   第一步:修改my.conf文件:在[mysqld]段下添加:#启
集群搭建
2017-09-01

tomcat集群搭建的方法有哪些

搭建Tomcat集群的方法有以下几种:1. 负载均衡器:使用负载均衡器(如Nginx、Apache)来接收客户端请求,并将请求分发给多个Tomcat服务器。负载均衡器可以根据服务器的负载情况、性能指标等进行智能分发,从而实现请求的均衡分配。
2023-09-06

在linux上搭建Solr集群的方法

什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud。当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,
2022-06-03

ubuntu集群搭建的方法是什么

要搭建Ubuntu集群,可以按照以下步骤进行:1. 安装Ubuntu操作系统:在每个节点上安装Ubuntu操作系统。可以选择最新版本的Ubuntu Server。2. 配置网络:确保每个节点都能够相互通信,可以使用静态IP或DHCP来配置网
2023-09-21

redis集群搭建的方法是什么

要搭建Redis集群,可以按照以下步骤进行操作:1. 准备多台服务器,每台服务器上都安装Redis。2. 在每台服务器上的Redis配置文件中,将cluster-enabled参数设置为yes,cluster-config-file参数设置
2023-09-09

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录