Hadoop源码分析一架构关系简介

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

1、简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构

Hadoop起源于谷歌发布的三篇论文：GFS、MapReduce、BigTable。其中GFS是谷歌的分布式文件存储系统，MapReduce是基于这个分布式文件存储系统的一个计算框架，BigTable是一个分布式的数据库。hadoop实现了论文GFS和MapReduce中的内容，Hbase的实现了参考了论文BigTable。

2、 hadoop架构

hadoop主要有三个组件

HDFS、YARN和MapReduce。其中YARN是hadoop2.x版本推出的。本文基于hadoop2.7.6分析。

HDFS是基于谷歌的GFS实现的，它是一个分布式的文件系统。YARN是一个资源管理系统，主要负责管理集群内的cpu和内存等资源，为MapReduce等计算任务分配资源。MapReduce即上文提到的计算框架。

hadoop的这三个组件间的关系如下图：

在这里插入图片描述

在hadoop1.x中YARN和MapReduce是集成在一起的，没有单独的资源管理，MapReduce执行时需要的资源由其自身的服务来确定。在2.x版本后将资源管理独立了出来，将资源管理和计算进行解耦合，使得大数据的其他计算框架也可以使用hadoop的资源管理系统。这样可以保证集群内的资源的统一调配。

3、源码分析思路

在分析hadoop之前需要配置部署一个hadoop平台

然后先从hdfs开始分析，hdfs是yarn和MapReduce的根基。

hdfs是一个文件系统，它涉及的角色较多，主要会先从namenode开始解析，namenode属于hdfs的中心节点，hdfs的所有角色都与其有交互。

解析namenode，首先需要解析其启动过程，namenode的启动过程较为复杂，与其他角色也有交互，所以在这个过程中也会解析其他的角色与节点。

然后使用一个文件的上传与下载，来解析hdfs的文件操作。

解析完了hdfs之后在继续解析yarn和MapReduce，因为者两个原本就是在一起协同工作的，所以解析这两个的时候需要一起解析。解析yarn和MapReduce的时候，使用一个MapReduce程序，以其在整个框架中的执行流程来分析这个两个框架。

以上就是Hadoop源码分析一架构关系简介的详细内容，本系列下一篇文章传送门Hadoop源码分析二安装配置过程详解

后续Hadoop源码分析系列文章的资料请持续关注编程网！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Hadoop源码分析一架构关系简介

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Hadoop源码分析一架构关系简介

1、简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构

2、 hadoop架构

hadoop主要有三个组件

3、源码分析思路

在分析hadoop之前需要配置部署一个hadoop平台

Hadoop源码分析一架构关系简介

相关文章

猜你喜欢

Hadoop源码分析一架构关系简介

Hadoop源码分析五hdfs架构原理剖析

[Apache Atlas] Atlas 架构设计及源代码简单分析

RocketMQ之NameServer架构设计及启动关闭流程源码分析

热门标签

编程热搜

Python 学习之路 - Python

chatgpt的中文全称是什么

C/C++中extern函数使用详解

C/C++可变参数的使用

css样式文件该放在哪里

php中数组下标必须是连续的吗

Python 3 教程

Python pip包管理

ubuntu如何重新编译内核

改善Java代码之慎用java动态编译

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

Hadoop源码分析一架构关系简介

1、 简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构

2、 hadoop架构

hadoop主要有三个组件

3、 源码分析思路

在分析hadoop之前需要配置部署一个hadoop平台

Hadoop源码分析一架构关系简介

相关文章

猜你喜欢

Hadoop源码分析一架构关系简介

Hadoop源码分析五hdfs架构原理剖析

[Apache Atlas] Atlas 架构设计及源代码简单分析

RocketMQ之NameServer架构设计及启动关闭流程源码分析

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复

1、简介

3、源码分析思路