我的编程空间,编程开发者的网络收藏夹
学习永远不晚

在Ubuntu 18.04.1中怎么安装Hadoop集群

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

在Ubuntu 18.04.1中怎么安装Hadoop集群

这篇文章给大家介绍在Ubuntu 18.04.1中怎么安装Hadoop集群,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。

准备运行Hadoop服务器

首先,我们需要安装Oracle Java 8,因为从Ubuntu 18.04.1开始,Java 8不再可用。

# add-apt-repository ppa:webupd8team/java# apt update# apt install -y oracle-java8-set-default

接受许可条款,并下载Hadoop二进制文件

# wget http://apache.claz.org/hadoop/common/hadoop-3.1.1/hadoop-3.1.1.tar.gz

解压缩归档并将其移至/ usr / local /

# tar -xzvf hadoop-3.1.1.tar.gz# mv hadoop-3.1.1 /usr/local/hadoop

更新默认环境变量以包含JAVA_HOME和Hadoop二进制目录。

首先,我们需要知道Java的安装位置,运行以下命令查找。

# update-alternatives --display javajava - manual mode  link best version is /usr/lib/jvm/java-8-oracle/jre/bin/java  link currently points to /usr/lib/jvm/java-8-oracle/jre/bin/java  link java is /usr/bin/java  slave java.1.gz is /usr/share/man/man1/java.1.gz/usr/lib/jvm/java-8-oracle/jre/bin/java - priority 1081  slave java.1.gz: /usr/lib/jvm/java-8-oracle/man/man1/java.1.gz

如上所示,JAVA_HOME应设置为/ usr / lib / jvm / java-8-oracle / jre。

打开/etc/environment并更新PATH行以包含Hadoop二进制目录。

PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/usr/local/hadoop/bin:/usr/local/hadoop/sbin"

为JAVA_HOME变量和YARN_RESOURCEMANAGER_OPTS变量添加一行。

vim YARN_RESOURCEMANAGER_OPTS="--add-modules=ALL-SYSTEM"

确保该目录与上面的update-alternatives选项减去bin/java部分的输出相匹配。

接下来,我们将添加一个hadoop用户并为他们提供正确的权限。

# adduser hadoop# usermod -aG hadoop hadoop# chown hadoop:root -R /usr/local/hadoop# chmod g+rwx -R /usr/local/hadoop

以hadoop用户身份登录并生成SSH密钥,只需要在Hadoop Master上完成此步骤。

# su - hadoop# ssh-keygen -t rsa

接受ssh-keygen的所有默认值。

现在以hadoop用户身份登录并将SSH密钥复制到所有Hadoop节点。 同样,只需要在Hadoop Master上完成此步骤。

# su - hadoop$ ssh-copy-id hadoop@hadoop1.admintome.lab$ ssh-copy-id hadoop@hadoop2.admintome.lab$ ssh-copy-id hadoop@hadoop3.admintome.lab

配置Hadoop主服务器

打开/usr/local/hadoop/etc/hadoop/core-site.xml文件并输入以下内容:

<configuration>  <property>    <name>fs.default.name</name>    <value>hdfs://hadoop1.admintome.lab:9000</value>  </property></configuration>

保存并退出。

接下来,打开/usr/local/hadoop/etc/hadoop/hdfs-site.xml文件并添加以下内容:

<configuration>  <property>    <name>dfs.namenode.name.dir</name>    <value>/usr/local/hadoop/data/nameNode</value>  </property>  <property>    <name>dfs.datanode.data.dir</name>    <value>/usr/local/hadoop/data/dataNode</value>  </property>  <property>    <name>dfs.replication</name>    <value>2</value>  </property></configuration>

保存并退出。

打开/usr/local/hadoop/etc/hadoop/workers文件并添加以下两行(每个Hadoop节点一行)

hadoop2.admintome.labhadoop3.admintome.lab

保存并退出。

将配置文件从Hadoop Master复制到每个Hadoop节点。

# scp /usr/local/hadoop/etc/hadoop/* hadoop2.admintome.lab:/usr/local/hadoop/etc/hadoop/# scp /usr/local/hadoop/etc/hadoop/* hadoop3.admintome.lab:/usr/local/hadoop/etc/hadoop/

格式化HDFS文件系统

$ source /etc/environmnet$ hdfs namenode -format

现在可以启动HDFS:

hadoop@hadoop1:~$ start-dfs.shStarting namenodes on [hadoop1.admintome.lab]Starting datanodesStarting secondary namenodes [hadoop1]hadoop@hadoop1:~$

通过在所有Hadoop服务器上以Hadoop用户身份运行jps命令来验证所有内容是否正确启动。

在Hadoop Master上你应该可以看到如下结果:

hadoop@hadoop1:~$ jps13634 Jps13478 SecondaryNameNode13174 NameNode

在每个Hadoop节点上,你应该可以看到:

hadoop@hadoop2:~$ jps8672 Jps8579 DataNodeHDFS Web UI

HDFS Web UI

现在,我们可以通过浏览到Hadoop主服务器端口9870来访问HDFS Web UI。

http://hadoop1.admintome.lab:9870

可以看到如下UI:

在Ubuntu 18.04.1中怎么安装Hadoop集群

如上所示,我们的HDFS文件系统上有近60 GB的空闲空间。

开始运行Yarn

现在HDFS正在运行,我们已准备好启动Yarn调度程序。

Hadoop本身需要运行任务,因此我们需要Yarn以在Hadoop集群上合理安排任务。

export HADOOP_HOME="/usr/local/hadoop"export HADOOP_COMMON_HOME=$HADOOP_HOMEexport HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoopexport HADOOP_HDFS_HOME=$HADOOP_HOMEexport HADOOP_MAPRED_HOME=$HADOOP_HOMEexport HADOOP_YARN_HOME=$HADOOP_HOME

运行以下命令以启动Yarn:

$ start-yarn.shStarting resourcemanagerStarting nodemanagers

我们可以通过以下命令来验证是否可以正确启动:

$ yarn node -list2018-08-15 04:40:26,688 INFO client.RMProxy: Connecting to ResourceManager at hadoop1.admintome.lab/192.168.1.35:8032Total Nodes:2         Node-Id       Node-State  Node-Http-Address  Number-of-Running-Containershadoop3.admintome.lab:35337          RUNNING  hadoop3.admintome.lab:8042                             0hadoop2.admintome.lab:38135          RUNNING  hadoop2.admintome.lab:8042                             0

没有任何正在运行的容器,因为我们还没有开始任何工作。

Hadoop Web UI

我们可以通过以下URL来查看Hadoop Web UI:

http://hadoop1.admintome.lab:8088/cluster

替换Hadoop Master主机名:

在Ubuntu 18.04.1中怎么安装Hadoop集群

运行Hadoop任务示例

我们现在可以运行Hadoop任务示例并在集群上安排它,我们将运行的示例是使用MapReduce来计算PI。

运行以下命令来运行作业:

yarn jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.1.jar pi 16 1000

完成整个过程将需要几分钟的时间。完成后,应该可以看到它已经开始计算PI:

Job Finished in 72.973 secondsEstimated value of Pi is 3.1425000000000000000

关于在Ubuntu 18.04.1中怎么安装Hadoop集群就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

在Ubuntu 18.04.1中怎么安装Hadoop集群

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

在Ubuntu 18.04.1中怎么安装Hadoop集群

这篇文章给大家介绍在Ubuntu 18.04.1中怎么安装Hadoop集群,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。准备运行Hadoop服务器首先,我们需要安装Oracle Java 8,因为从Ubuntu 18.
2023-06-02

Ubuntu 18.04.1中怎么安装Elasticsearch

Ubuntu 18.04.1中怎么安装Elasticsearch,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。首先,我们从安装Ubuntu Server 18.04.1开始
2023-06-02

linux怎么安装hadoop集群

要在Linux上安装Hadoop集群,您可以按照以下步骤进行操作:1. 首先确保您已经安装了Java JDK。Hadoop依赖于Java环境,因此必须先安装Java JDK。您可以通过运行以下命令来检查Java是否已安装:```java -
2023-10-11

docker怎么安装hadoop集群

要在Docker中安装Hadoop集群,可以按照以下步骤进行操作:1. 首先,确保你的机器上已经安装了Docker。你可以通过运行`docker --version`来检查Docker是否已经安装。2. 创建一个新的Docker网络,该网络
2023-10-11

Hadoop集群怎样安装

这篇文章主要为大家展示了“Hadoop集群怎样安装”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“Hadoop集群怎样安装”这篇文章吧。一、安装环境 因为安装Hadoop集群需要的主机数量必须为奇
2023-06-03

怎么在Ubuntu 16.04中安装Ceph存储集群

这篇文章给大家分享的是有关怎么在Ubuntu 16.04中安装Ceph存储集群的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。Ceph 是一个高性能、可靠、可扩展的开源存储平台。它是一个自由的分布式存储系统,提供
2023-06-16

hadoop伪分布式集群怎么安装

Hadoop伪分布式集群是在单台机器上模拟多台机器的Hadoop集群环境,可以用来进行开发和测试。以下是Hadoop伪分布式集群的安装步骤:下载并解压Hadoop首先,从Hadoop官网下载最新版本的Hadoop压缩包,并解压到指定目录。
hadoop伪分布式集群怎么安装
2024-03-13

Hadoop多节点集群怎么安装配置

本篇内容主要讲解“Hadoop多节点集群怎么安装配置”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Hadoop多节点集群怎么安装配置”吧!1、集群部署介绍 1.1 Hadoop简介 Hadoop
2023-06-03

Ubuntu 16.04中怎么安装Ceph存储集群

这篇文章主要介绍了Ubuntu 16.04中怎么安装Ceph存储集群的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Ubuntu 16.04中怎么安装Ceph存储集群文章都会有所收获,下面我们一起来看看吧。Cep
2023-06-28

linux系统怎么安装hadoop真分布式集群

这篇“linux系统怎么安装hadoop真分布式集群”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“linux系统怎么安装ha
2023-06-30

docker安装hadoop集群的方法是什么

要在Docker中安装Hadoop集群,可以按照以下步骤进行:1. 首先,确保已经安装了Docker和Docker Compose。2. 创建一个包含Hadoop集群配置的Docker Compose文件,例如`docker-compose
2023-08-16

ambari中怎么部署hadoop集群

在Ambari中部署Hadoop集群通常需要按照以下步骤进行操作:登录到Ambari的Web界面,并创建一个新的集群。在创建集群的过程中,需要指定节点主机和组件的配置信息,包括Hadoop的各个组件(如HDFS、YARN、MapReduc
ambari中怎么部署hadoop集群
2024-03-14

Linux下安装Hadoop集群的步骤是什么

Linux下安装Hadoop集群的步骤是什么,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。1.在usr目录下创建Hadoop目录,将安装包导入目录中并解压文件 2.进入vi
2023-06-22

CentOS7中怎么安装 Kubernetes集群

CentOS7中怎么安装 Kubernetes集群,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。CentOS7(mini) 安装 Kubernetes 集群(kubeadm
2023-06-19

怎么在vmware中搭建一个Hadoop集群环境

怎么在vmware中搭建一个Hadoop集群环境?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。先在虚拟机中关闭系统右键虚拟机,点击管理,选择克隆3.点击下一步,
2023-06-14

怎么在docker中搭建一个Hadoop集群环境

这篇文章给大家介绍怎么在docker中搭建一个Hadoop集群环境,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。docker安装1、国际惯例更新下apt软件包的源 curl -fssl https://mirrors.
2023-06-07

Facebook中怎么实现Hadoop和AvatarNode集群

这篇文章给大家介绍Facebook中怎么实现Hadoop和AvatarNode集群,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。Facebook将数据存储在利用Hadoop/Hive搭建的数据仓库上,这个数据仓库拥有4
2023-06-10

hadoop中的yarn怎么创建session集群

在Hadoop中创建YARN Session集群可以通过以下步骤实现:首先,需要在Hadoop集群中安装和配置YARN。确保YARN的配置文件(如yarn-site.xml)中已经正确设置了相关参数。在Hadoop集群的一个节点上启动YAR
hadoop中的yarn怎么创建session集群
2024-03-13

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录