我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HDFS数据存储流程

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HDFS数据存储流程

HDFS数据存储流程

HDFS即Hadoop Distributed File System, HDFS存储数据的流程如下:

client跟NameNode交互
1.1、client 发消息给NameNode,NameNode检查client是否有写的权限。如果有权限,NameNode检查是否有同名文件,如果没同名文件,NameNode生成一条新文件的记录(不包含存放地址信息)
1.2、NameNode向client发送相应的DataNode列表和一个token,地址用来存放数据,token是client向DataNode写数据前要发送过去的密钥
2、client跟DataNode交互
2.1、client收到DataNode列表和token后,其DFSOutputStream将数据拆分成一个个块(一般64MB或128MB),并集群中生成管道,通过管道向DataNode列表中的第一个DataNode写入数据。 同时,DFSOutputStream生成一个确认列表(ack queue)。
2.2、第一个DataNode写完后,将根据复制参数将数据块通过管道复制到第二个DataNode。第二个写完,将数据块通过管道复制到第三个DataNode...... 如果复制参数为 3,那么在不同的 DataNode 中至少会创建 3 个块副本。每个DataNode写完后,会向NameNode发送块的信息,NameNode会记录下来。
2.3、最后一个DataNode创建所需的副本后,向前一个DataNode发送确认信息,前一个往再前一个DataNode发确认信息...... 第一个DataNode向client发送确认信息,client的DFSOutputStream收到确认信息后,将该块从确认列表(ack queue)中移除
2.4、重复2.1——2.3的过程,直到所有数据块传输完成
2.5、当数据传送完成,且收到确认信息时,client调用close()方法关闭进程

图片是简单的流程,可以参考:

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HDFS数据存储流程

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

HDFS数据存储流程

HDFS即Hadoop Distributed File System, HDFS存储数据的流程如下:1、client跟NameNode交互1.1、client 发消息给NameNode,NameNode检查client是否有写的权限。如果有权限,NameNo
HDFS数据存储流程
2019-11-16

hdfs存储数据的优点有哪些

可靠性高:HDFS使用数据冗余的方式存储数据,通过数据块的复制和分布式存储方式,保证数据的可靠性和容错性。扩展性好:HDFS可以很容易地扩展存储容量,只需增加节点即可实现存储空间的扩展,可以支持PB级别的数据存储。高吞吐量:HDFS可以并行
hdfs存储数据的优点有哪些
2024-04-18

HDFS怎么支持数据的分层存储

HDFS支持数据的分层存储通过以下两种方式实现:HDFS命名空间:HDFS的文件系统命名空间是一个树状结构,用户可以在命名空间中创建文件夹和文件,并按照自己的需求对数据进行分层存储。通过在命名空间中创建不同的文件夹,用户可以将数据按照不同的
HDFS怎么支持数据的分层存储
2024-05-08

HDFS的元数据如何存储和访问

HDFS(Hadoop分布式文件系统)的元数据存储在称为NameNode的主服务器上,这些元数据包括文件和目录的信息,例如文件名、文件大小、文件权限、文件所有者等。NameNode还维护了文件块的映射信息,即哪些数据块属于哪个文件。元数据
HDFS的元数据如何存储和访问
2024-05-08

hdfs分布式存储数据的原理是什么

HDFS(Hadoop Distributed File System)是一种分布式文件系统,它由多个节点组成,每个节点都可以存储数据和执行计算任务。HDFS的原理主要包括以下几个方面:数据块划分:HDFS将文件划分为固定大小的数据块(通常
hdfs分布式存储数据的原理是什么
2024-04-09

怎么优化HDFS的数据传输和存储性能

要优化HDFS的数据传输和存储性能,可以考虑以下几个方面:使用更高效的网络和硬件设备:确保集群中的网络和硬件设备能够支持高速数据传输和存储,并且保持良好的稳定性和可靠性。调整副本数量:通过调整HDFS中数据块的副本数量来提高数据传输和存储性
怎么优化HDFS的数据传输和存储性能
2024-05-08

MySQL存储过程:简化数据库操作流程

MySQL存储过程:简化数据库操作流程MySQL存储过程是一组为了完成特定任务而预定义的SQL语句集合,可以被多次调用以执行相同的任务。通过存储过程,我们可以简化数据库操作的流程,提高数据库的性能和安全性。本文将介绍MySQL存储过程的概
MySQL存储过程:简化数据库操作流程
2024-03-14

数据库存储过程

原文:https://www.cnblogs.com/gfutcan/p/13946765.html
数据库存储过程
2015-11-12

C语言数据在内存中的存储流程深入分析

使用编程语言进行编程时,需要用到各种变量来存储各种信息。变量保留的是它所存储的值的内存位置。这意味着,当您创建一个变量时,就会在内存中保留一些空间。您可能需要存储各种数据类型的信息,操作系统会根据变量的数据类型,来分配内存和决定在保留内存中存储什么
2022-11-13

怎么高效迁移HDFS数据到另一个存储系统中

迁移HDFS数据到另一个存储系统中可以采用以下一些方法来实现高效迁移:使用DistCp工具:DistCp是Hadoop提供的一个用于在Hadoop集群之间复制数据的工具,可以实现高效、并行地复制大规模数据。可以使用DistCp将HDFS数据
怎么高效迁移HDFS数据到另一个存储系统中
2024-05-08

mysql数据的存储过程

MySQL存储过程是一组预定义的SQL语句集合,可以在数据库中进行预先编译和存储,并在需要时进行调用和执行。存储过程通常用于处理复杂的业务逻辑和重复的数据库操作。以下是创建和执行MySQL存储过程的一般步骤:1. 创建存储过程:使用CREA
2023-08-22

Android基础教程数据存储之文件存储

Android基础教程数据存储之文件存储将数据存储到文件中并读取数据1、新建FilePersistenceTest项目,并修改activity_main.xml中的代码,如下:(只加入了EditText,用于输入文本内容,不管输入什么按下b
2023-05-30

mysql数据库存储过程教程

mysql 存储过程是预编译的 sql 语句集合,可作为单个单元执行,提供提高性能、代码重用、安全性、数据完整性等优势。创建存储过程需要确定功能、编写代码、使用 create procedure 语句创建、使用 call 语句测试。例如,获
mysql数据库存储过程教程
2024-08-01

【Android】数据存储

Content1. 保存数据到文件1.1. 内部、外部存储区1.2. 在内部存储区 (internal) 存放文件1.3. 在外部存储区 (external) 存放文件2. 使用共享首选项(Shared Preferences)3. 序列化
2022-06-06

编程热搜

目录