我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何使用cloudrea的rpm源安装Hadoop

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何使用cloudrea的rpm源安装Hadoop

这篇文章主要介绍了如何使用cloudrea的rpm源安装Hadoop,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

使用cloudrea的rpm源,安装Hadoop
环境为:
192.168.255.132 test01.linuxjcq.com =》master
192.168.255.133 test02.linuxjcq.com =》slave01
192.168.255.134 test03.linuxjcq.com =》slave02
 
每台主机中的/etc/hosts文件有以上配置和基本的java环境设置,使用的java包为openjdk
1. 安装cloudrea
wget http://archive.cloudera.com/RedHat/6/x86_64/cdh/cdh4-repository-1.0-1.noarch.rpm -P /usr/local/class="lazy" data-src
yum localinstall --nogpgcheck /usr/local/class="lazy" data-src/cdh4-repository-1.0-1.noarch.rpm
rpm --import http://archive.cloudera.com/redhat/6/x86_64/cdh/RPM-GPG-KEY-cloudera
 
2. 安装hadoop包
yum install -y hadoop-0.20 hadoop-0.20-namenode hadoop-0.20-secondarynamenode hadoop-0.20-datanode hadoop-0.20-jobtracker hadoop-0.20-tasktracker hadoop-0.20-source
将hadoop按照各个部分的功能分为了
source:hadoop-0.20-source
base:hadoop-0.20
namenode:hadoop-0.20-namenode
secondnamenode:hadoop-0.20-secondarynamenode
jobtracker:hadoop-0.20-jobtracker
tasktracker:hadoop-0.20-tasktracker
 
同时会默认添加两个用户和一个组
hdfs用户用于操作hdfs文件系统
mapred用户用于mapreduce工作
这两个用户都属于hadoop组,不存在hadoop用户。
以上1,2在每一个节点都需进行操作

3. 配置master节点
a. 创建配置
cloudrea配置可以通过alternatives工具
cp -r /etc/Hadoop-0.20/conf.empty /etc/hadoop-0.20/conf.my_cluster

复制配置文件
alternatives --display hadoop-0.20-conf
alternatives --install /etc/hadoop-0.20/conf
hadoop-0.20-conf /etc/hadoop-0.20/conf.my_cluster 50

查看配置,并安装新的配置
alternatives --display hadoop-0.20-conf
hadoop-0.20-conf - status is auto.
link currently points to /etc/hadoop-0.20/conf.my_cluster
/etc/hadoop-0.20/conf.empty - priority 10
/etc/hadoop-0.20/conf.my_cluster - priority 50
Current `best' version is /etc/hadoop-0.20/conf.my_cluster.
确认安装了新配置

b. 设置java主目录
    vim hadoop-env.sh
    export JAVA_HOME=/usr/lib/jvm/java-1.6.0-openjdk-1.6.0.0.x86_64
JAVA_HOME为JAVA的主目录,可以使用OPENJDK

c. 设置core-site.xml
    vim core-site.xml
    <configuration>
    <property>
    <name>fs.default.name</name>
    <value>hdfs://test01.linuxjcq.com:9000/</value>
    </property>
    </configuration>
使用这个访问hdfs文件系统

d. 设置hdfs-site.xml
    vim /etc/hadoop/hdfs-site.xml
    <configuration>
    <property>
    <name>dfs.replication</name>
    <value>2</value>
    </property>
    <property>
    <name>dfs.name.dir</name>
    <value>/data/hadoop/hdfs/name</value>
    </property>
    <property>
    <name>dfs.data.dir</name>
    <value>/data/hadoop/hdfs/data</value>
    </property>
    </configuration>

e. 设置mapred-site.xml
    <configuration>
    <property>
    <name>mapred.system.dir</name>
    <value>/mapred/system</value>
    </property>
    <property>
    <name>mapred.local.dir</name>
    <value>/data/hadoop/mapred/local</value>
    </property>
    <property>
    <name>mapred.job.tracker</name>
    <value>test01.linuxjcq.com:9001</value>
    </property>
    </configuration>

f. 设置secondnamenode和datanode
secondnamenode
vim /etc/hadoop/masters
test02.linuxjcq.com

datanode
test02.linuxjcq.com
test03.linuxjcq.com

g. 创建相应的目录
创建dfs.name.dir和dfs.data.dir
mkdir -p /data/hadoop/hdfs/{name,data}

创建mapred.local.dir
mkdir -p /data/hadoop/mapred/local

修改dfs.name.dir和dfs.data.dir拥有者为hdfs,组拥有者为hadoop,目录权限为0700
chown -R hdfs:hadoop /data/hadoop/hdfs/{name,data}
chmod -R 0700 /data/hadoop/hdfs/{name,data}

修改mapred.local.dir拥有者为mapred,组拥有者为hadoop,目录权限为755
chown -R mapred:hadoop /data/hadoop/mapred/local
chmod -R 0755 /data/hadoop/mapred/local

4. 配置secondnamenode和datanode节点
重复3中的步骤a-f

5. 在master节点上格式化namenode
sudo -u hdfs hadoop namenode -format

6. 启动节点
master启动namenode
service Hadoop-0.20-namenode start
 
secondnamenode启动
service hadoop-0.20-secondnamenode start
 
启动各个数据节点
service hadoop-0.20-datanode start
 
7. 创建hdfs的/tmp目录和mapred.system.dir
sudo -u hdfs hadoop fs -mkdir /mapred/system
sudo -u hdfs hadoop fs -chown mapred:hadoop /mapred/system
sudo -u hdfs hadoop fs -chmod 700 /mapred/system
 
mapred.system.dir需要在jobtracker启动前创建
sudo -u hdfs hadoop dfs -mkdir /tmp
sudo -u hdfs hadoop dfs -chmod -R 1777 /tmp
 
8. 开启mapreduce
在datanode节点上执行
service hadoop-0.20-tasktracker start
 
在namenode节点上启动jobtracker
service hadoop-0.20-jobtasker start
 
9. 设置开机启动
namenode节点:需要启动的为namenode何jobtracker,关闭其他的服务
chkconfig hadoop-0.20-namenode on
chkconfig hadoop-0.20-jobtracker on
chkconfig hadoop-0.20-secondarynamenode off
chkconfig hadoop-0.20-tasktracker off
chkconfig hadoop-0.20-datanode off
 
datanode节点:需要启动datanode和tasktracker
chkconfig hadoop-0.20-namenode off
chkconfig hadoop-0.20-jobtracker off
chkconfig hadoop-0.20-secondarynamenode off
chkconfig hadoop-0.20-tasktracker on
chkconfig hadoop-0.20-datanode on
 
secondarynamenode节点:需要启动secondarynamenode
chkconfig hadoop-0.20-secondarynamenode on
 
说明:
这些hadoop包作为独立的服务启动,不需要通过ssh,也可以配置ssh,通过使用start-all.sh和stop-all.sh来管理服务。

感谢你能够认真阅读完这篇文章,希望小编分享的“如何使用cloudrea的rpm源安装Hadoop”这篇文章对大家有帮助,同时也希望大家多多支持编程网,关注编程网行业资讯频道,更多相关知识等着你来学习!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何使用cloudrea的rpm源安装Hadoop

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何使用cloudrea的rpm源安装Hadoop

这篇文章主要介绍了如何使用cloudrea的rpm源安装Hadoop,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。使用cloudrea的rpm源,安装Hadoop环境为:19
2023-06-03

Linux中rpm命令如何安装使用

这篇文章主要介绍了Linux中rpm命令如何安装使用,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。现在有很多人都在使用Linux操作系统,对于在Linux操作系统中各种命令的
2023-06-16

Linux下如何使用RPM包安装Dovecot

这篇文章将为大家详细讲解有关Linux下如何使用RPM包安装Dovecot,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Dovecot介绍MRA邮件取回代理也有很多如courier-imap,cyrus-
2023-06-27

如何安装与使用Hadoop组件

本篇文章给大家分享的是有关如何安装与使用Hadoop组件,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。安装hbase首先下载hbase的最新稳定版本安装到本地目录中,我安装的是
2023-05-31

如何使用rpm安装指定版本docker

这篇文章给大家分享的是有关如何使用rpm安装指定版本docker的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。一.原因  如果系统是Centos7.3,直接使用yum install docker安装的docke
2023-06-20

linux下如何用rpm安装mysql

今天小编给大家分享一下linux下如何用rpm安装mysql的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。方法:1、用“pm
2023-06-30

linux如何从一个rpm源码安装一个构建好的包

从RPM源代码安装预编译包是一种自动化Linux软件安装过程的方法。需要以下步骤:获取并准备源代码。解压并编译源代码。安装构建的RPM包。验证安装。遵循这些步骤可从源代码中安装预编译的RPM包,并自动化软件安装和管理。
linux如何从一个rpm源码安装一个构建好的包
2024-04-02

如何使用rpm文件手动安装CentOS authlib软件

本篇文章为大家展示了如何使用rpm文件手动安装CentOS authlib软件,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。下面介绍使用rpm安装CentOS authlib软件步骤操作。A、Cen
2023-06-16

linux上如何使用源码安装swoole

这篇“linux上如何使用源码安装swoole”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“linux上如何使用源码安装sw
2023-07-05

linux下如何使用yum源安装mysql

目录使用网络yum源安装mysql(1)检查(2)查看(3)安装(4)启动服务(5)自启动(6)创建管理员(7)登录总结使用网络yum源安装mysql(1)检查 (2)查看 (3)安装 (4)启动服务 (5)自启动 (6)
2022-12-16

Linux(CentOS7)使用 RPM 安装 mysql 8.0.11的教程

一、安装准备工作 1、查看 Linux 相关信息(Linux 命令行操作) (1)查看 Linux 版本,用于下载对应的 mysql。 【查看 Linux 信息:】 uname -a (2)检查是否已经安装过 mysql。【检查 mysql
2022-05-27

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录