我的编程空间,编程开发者的网络收藏夹
学习永远不晚

CDH集群调优的方法是什么

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

CDH集群调优的方法是什么

本文小编为大家详细介绍“CDH集群调优的方法是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“CDH集群调优的方法是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

DRF和相关参数

DRF: Dominant Resource Fairness,根据CPU和内存公平调度资源。CDH动态资源池默认采用的DRF计划策略。简单的理解就是内存不够的时候,多余的CPU就不会分配任务了,就让他空着;CPU不够的时候,多出来的内存也不会再启动任务了。

理解这个计划策略后,再查看Yarn启动任务时资源相关的参数,发现有以下几个参数可能会产生影响:

  • mapreduce.map.memory.mb ,map任务内存,cdh默认1G

  • mapreduce.map.cpu.vcores ,map任务虚拟CPU核数,cdh默认1

  • mapreduce.reduce.memory.mb ,reduce任务内存,cdh默认1G

  • mapreduce.reduce.cpu.vcores ,reduce任务虚拟CPU核数,cdh默认1

  • yarn.nodemanager.resource.memory-mb ,容器内存,cdh默认8G

  • yarn.nodemanager.resource.cpu-vcores ,容器虚拟CPU核数,cdh默认8,但CM会自动检测内核数并修改,我这里被自动改成了24。

可以看到默认配置下,CPU核数和内存是1:1G的比例来启动任务的。

接着查看了下分配给Yarn的内存,果然是8×15=120G,所以可用内存比可用vcores(360个)比起来就小太多了,导致按照1:1G的比例下最多只能使用120个vcores。

测试

为了证实我的猜想,将     yarn.nodemanager.resource.memory-mb     调成了16G(咱内存128G,管够)。重启yarn后,再次启动MR,于是有了下图:

CDH集群调优的方法是什么

可以看到参数调整前,Yarn可用内存为120G,调整后变成了240G;vcores由调整前的120变成了240。至此,证明猜想正确。

所以对于这个集群来说,由于内存为128G,内核为24个,所以完全可以将    yarn.nodemanager.resource.memory-mb    参数调成24G,这样就能将所有的CPU都利用起来了。

测试结果

yarn.nodemanager.resource.memory-mb    为8G时:

Time taken: 3794.17 secondsTotal MapReduce CPU Time Spent: 3 days 10 hours 43 minutes 22 seconds 640 msec

yarn.nodemanager.resource.memory-mb    为16G时:

Time taken: 2077.138 secondsTotal MapReduce CPU Time Spent: 3 days 12 hours 55 minutes 43 seconds 210 msec

可以看到确实快了很多很多。(ps:两次跑的任务所用的数据不一样,以免缓存导致第二次跑相同的任务会速度比第一次快,但两次任务所用的数据量差不多,都在650G左右)

其它

查看VCores SQL
SELECT allocated_vcores_cumulative, available_vcores where category=YARN_POOL and serviceName="yarn" and queueName=root
查看分配给Yarn的内存 SQL
SELECT allocated_memory_mb_cumulative, available_memory_mb where category=YARN_POOL and serviceName="yarn" and queueName=root

当然最简单的查看方式就是在CM的“动态资源池”页面看。

读到这里,这篇“CDH集群调优的方法是什么”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

CDH集群调优的方法是什么

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

CDH集群调优的方法是什么

本文小编为大家详细介绍“CDH集群调优的方法是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“CDH集群调优的方法是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。DRF和相关参数DRF: Dominant
2023-06-03

Kafka集群优化的方法是什么

这篇文章主要介绍了Kafka集群优化的方法是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇Kafka集群优化的方法是什么文章都会有所收获,下面我们一起来看看吧。背景个推作为专业的数据智能服务商,已经成功服务
2023-06-04

tomcat集群部署的方法是什么

Tomcat集群部署可以通过多种方法实现,以下是常见的几种方法:1.硬件负载均衡器:使用硬件负载均衡器(如F5 Big-IP、Nginx等)将请求分发到多个Tomcat服务器上,实现负载均衡和高可用性。2.软件负载均衡器:使用软件负载均衡器
2023-09-26

kubernetes集群重启的方法是什么

Kubernetes集群的重启方法有多种,取决于你的具体部署环境和需求。以下是一些常见的重启方法:1. 重启Kubernetes节点:你可以通过重启Kubernetes节点来重启整个集群。这可以通过使用系统管理工具(如systemctl)或
2023-10-07

springboot集群部署的方法是什么

Spring Boot可以使用多种方式进行集群部署,以下是一些常用的方法:1. 使用容器化技术部署:将Spring Boot应用打包成Docker镜像,然后使用容器编排工具(如Docker Compose、Kubernetes)进行部署和管
2023-09-05

weblogic集群部署的方法是什么

WebLogic集群部署有以下几种方法:1. 手动部署:手动在每个集群节点上安装WebLogic Server,并手动配置集群和节点管理器。然后在每个节点上部署应用程序,并手动启动和停止集群节点。2. 基于模板的部署:创建一个WebLogi
2023-10-12

ubuntu集群搭建的方法是什么

要搭建Ubuntu集群,可以按照以下步骤进行:1. 安装Ubuntu操作系统:在每个节点上安装Ubuntu操作系统。可以选择最新版本的Ubuntu Server。2. 配置网络:确保每个节点都能够相互通信,可以使用静态IP或DHCP来配置网
2023-09-21

redis集群搭建的方法是什么

要搭建Redis集群,可以按照以下步骤进行操作:1. 准备多台服务器,每台服务器上都安装Redis。2. 在每台服务器上的Redis配置文件中,将cluster-enabled参数设置为yes,cluster-config-file参数设置
2023-09-09

hadoop集群启动的方法是什么

Hadoop集群可以通过以下步骤启动:启动Hadoop集群的NameNode(主节点):在主节点上运行start-dfs.sh脚本。启动Hadoop集群的ResourceManager(资源管理器):在主节点上运行start-yarn.sh
hadoop集群启动的方法是什么
2024-03-05

mongodb集群搭建的方法是什么

搭建MongoDB集群有多种方法,以下是其中一种常用的方法:1. 安装MongoDB:首先需要在每个集群节点上安装MongoDB数据库。2. 配置MongoDB实例:对于每个节点,需要配置MongoDB实例的配置文件。其中包括指定数据目录、
2023-09-06

quartz集群配置的方法是什么

配置Quartz集群有以下几个步骤:1. 配置数据库:首先,需要准备一个数据库来存储Quartz的调度信息。可以使用MySQL、Oracle等关系型数据库。2. 配置数据源:在应用程序的配置文件中,配置数据源连接信息,以便Quartz能够连
2023-09-18

docker集群管理的方法是什么

Docker集群管理的方法有多种,以下是其中一些常用的方法:1. Docker Swarm:Docker Swarm是Docker官方提供的原生集群管理工具,它可以将多个Docker主机组成一个集群,并提供高可用、负载均衡、服务发现等功能。
2023-09-20

k8s集群部署的方法是什么

Kubernetes(简称为k8s)集群的部署方法有多种,可以根据实际需求选择适合的部署方法。以下是一些常见的部署方法:1. 手动部署:使用kubeadm、kubespray等工具手动部署Kubernetes集群。这种方法需要手动配置各个节
2023-10-24

mariadb集群搭建的方法是什么

这篇文章主要介绍了mariadb集群搭建的方法是什么的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇mariadb集群搭建的方法是什么文章都会有所收获,下面我们一起来看看吧。一、Galera ClusterMar
2023-07-05

mongodb集群迁移的方法是什么

迁移MongoDB集群可以采用以下方法:使用mongodump和mongorestore工具:首先在源集群中使用mongodump工具导出数据,然后将数据迁移到目标集群,并使用mongorestore工具进行数据导入。这种方法可以简单快速地
mongodb集群迁移的方法是什么
2024-05-22

kubernetes集群搭建的方法是什么

这篇文章主要介绍“kubernetes集群搭建的方法是什么”,在日常操作中,相信很多人在kubernetes集群搭建的方法是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”kubernetes集群搭建的方法
2023-06-27

mongodb集群设置的方法是什么

MongoDB集群设置的方法有以下几种:1. 副本集(Replica Set):副本集是一组运行在不同服务器上的MongoDB实例,其中一个实例被指定为主节点(Primary),其余实例为次节点(Secondary)。主节点负责处理所有的写
2023-08-23

hadoop集群使用的方法是什么

Hadoop集群使用的方法通常是通过Hadoop分布式文件系统(HDFS)存储和管理大规模数据,并使用MapReduce编程模型来处理数据。用户可以通过Hadoop集群的管理工具(如Ambari或Cloudera Manager)来监控和管
hadoop集群使用的方法是什么
2024-03-05

Java调优的方法是什么

本篇内容介绍了“Java调优的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Java 应用性能优化是一个老生常谈的话题,典型的性能
2023-06-15

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录