我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HDFS架构

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HDFS架构

HDFS架构

HDFS架构(Master-Slave)

  • 几个进程的角色
    1. nameNode(master):用于保存、管理、持久化文件的元数据(文件名、文件副本数、文件块大小、文件块列表),同时还要接收客户端的文件读写请求。
    2. secondaryNameNode:用于实时同步文件元数据,给nameNode服务做副本,担当高可用备份,nameNode处于正常状态时secondaryNameNode只sandBy。
    3. dataNode(slave):真正存储文件块,分布在每个节点上
    4. dfsClient:向hdfs发请求,当用户发起一个hdfs文件读、写、查询等请求时,集群都会启动一个dfsClient进程,dfsClient先访问nameNode获取文件元数据,然后根据元数据解析出文件分片的分布情况,最后去各dataNode完成真正的读写。它扮演着用户与hdfs交互中间人的角色,同时文件的拆分和拼装也是在dfsClient进程完成的。
  • HDFS文件读写流程
    • 读取:系统接收到用户读请求后,首先启动一个dfsClient进程,这个进程拿着用户传递的文件路径等信息,传递给nameNode,nameNode返回文件分片的分布节点列表,dfsClient就近读取文件分片,并将各分片拼装为完整文件返回给用户。
    • 写入:系统接收到用户写请求后,首先启动一个dfsClient进程,这个进程将写入文件的信息提交给nameNode,nameNode根据集群情况将文件进行分片和位置规划,再将规划信息返回给dfsClient,dfsClient根据规划信息将文件切分成特定的块,然后根据位置规划分别与对应的dataNode建立管道,将分片传输到对应的dataNode上。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HDFS架构

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

HDFS架构

HDFS架构(Master-Slave)几个进程的角色nameNode(master):用于保存、管理、持久化文件的元数据(文件名、文件副本数、文件块大小、文件块列表),同时还要接收客户端的文件读写请求。secondaryNameNode:用于实时同步文件元数
HDFS架构
2019-04-12

HDFS架构如何设计

这篇文章主要介绍HDFS架构如何设计,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!HDFS架构设计:1.NN(NameNode):主要是维护管理文件命名空间,其中包括了文件名称,文件的权限,创建时间,副本数,文件被分
2023-06-03

HDFS是如何设计架构的?

Hadoop到目前为止发展已经有10余年,版本经过无数次的更新迭代,目前业内大家把Hadoop大的版本分为Hadoop1.0、Hadoop2.0、Hadoop3.0 三个版本。

HDFS机架感知

通常大型 Hadoop 集群是以机架的形式来组织的,同一个机架上的不同节点间的网络状况比不同机架之间的更为理想,NameNode 设法将数据块副本保存在不同的机架上以提高容错性。 Hadoop版本:2.9.2什么是机架感知通常大型 Hadoop 集群是以
HDFS机架感知
2018-07-20

Hadoop分布式文件系统HDFS架构分析

本文小编为大家详细介绍“Hadoop分布式文件系统HDFS架构分析”,内容详细,步骤清晰,细节处理妥当,希望这篇“Hadoop分布式文件系统HDFS架构分析”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。Hadoo
2023-06-27

终于有人把HDFS架构和读写流程讲明白了

HDFS(Hadoop Distributed File System)是一种分布式文件系统,可运行在廉价的硬件上,能够处理超大文件以及提供流式数据操作。HDFS具有易扩展、高度容错、高吞吐量、高可靠性等特征,是处理大型数据集的强有力的工具

HDFS的体系结构有哪些

这篇文章主要介绍HDFS的体系结构有哪些,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!分布式文件系统HDFS是一种分布式文件系统,设计用于在商用硬件上运行,它与现有的分布式文件系统有许多相似之处。但是,与其他的分布式
2023-06-02

Hadoop-HDFS(HDFS

HDFS(Hadoop Distributed File System) 分布式文件系统,HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.由NameNode,若干DataNode,以及Se
Hadoop-HDFS(HDFS
2015-07-05

HDFS如何构建Hadoop监控共同体

这篇文章主要介绍了HDFS如何构建Hadoop监控共同体,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。HDFS监控挑战HDFS是Hadoop生态的一部分,监控方案不仅需适用H
2023-06-02

HDFS/HBase技术报告·分布式数据库设计架构的全面解析

Hadoop生态的分布式数据库1、什么是分布式数据库?从狭义的理解就是分布式关系型数据库,主要特指目前热门的NewSQL。从广义的理解,分库分表的传统关系型数据库,传统关系型数据库集群,关系型数据库的主从架构,分布式KV数据库(例如:HBase),分布式文档数
HDFS/HBase技术报告·分布式数据库设计架构的全面解析
2021-06-21

我们一起学习Hdfs的异构存储

在我们实际的开发过程中,我们的某些数据可能经常使用,但是过了一段时间,这个数据就不怎么使用了,即我们的数据存在一个热、温、冷等这些特性。那么针对数据的热度,我们可以采用不同的策略,存储到不同的存储介质上。

Hadoop体系结构之HDFS的示例分析

这篇文章将为大家详细讲解有关Hadoop体系结构之HDFS的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。 HDFS采用主从(Master/Slave)结构模型,一个HDFS集群是由一个Na
2023-06-03

HDFS中机架感知策略的示例分析

这篇文章将为大家详细讲解有关HDFS中机架感知策略的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。通常来说大型的Hadoop集群是以机架的形式来组织的他们分布在不同的机架上面,同一个机架节点往往通
2023-06-02

服务架构:分层架构

分层是一种职责分离和依赖管理的方式:每层都有自己特定的职能;高层的服务可以调用低层的服务,但是反过来不行。

Hadoop-HDFS

HDFS(Hadoop Distributed File System) 分布式文件系统,HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.由NameNode,若干DataNode,以及Se
Hadoop-HDFS
2014-06-17

服务架构:微服务架构

微服务架构是由很多小而自治的微服务组合而成,每个服务都提供一套独立自洽的业务能力。微服务的定义比较直白,但只有理解它的设计理念和原则,才能真正用好它。
微服务架构2024-11-30

服务架构:大数据架构

大数据,可以简单理解为传统数据库无法处理的数据量,比如主从模式的MySQL在简单场景下可以存储和处理上亿条数据,但涉及到分析场景,能处理的数据量可能远远小于1亿。利用大数据架构,可以轻松处理上亿到千亿数据的分析需求。

X86架构与Arm架构区别

近年来,ARM架构的的兴起下,许多巨头纷纷开始自研ARM架构的服务器芯片,包括国外的亚马逊、谷歌甚至微软,国内的腾讯、华为等等都积极参与其中。
架构芯片2024-11-30

编程热搜

目录