我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HDFS架构如何设计

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HDFS架构如何设计

这篇文章主要介绍HDFS架构如何设计,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

HDFS架构设计:
1.NN(NameNode):主要是维护管理文件命名空间,其中包括了文件名称,文件的权限,创建时间,副本数,文件被分成多少块,快分布在哪些机器(产生文件fsimage和editlog)。

2.理解NN管理下NN和块以及实际存储内容的存储关系。
实例:假设NN为一个容量为128000ML的正方形盒子,每个块为同样大小正正方方的容量为128ML的盒子,但是每个盒子里只有3ml的水(每个块中存储文件的实际大小)。

则问实际存储的内容是多少ml?3*(128000/128)=3000ml这里是由DN管理存储的。
放进去的盒子是多少个?1000个(其实就是存储的块的数量)
总的来说尽管实际存储只有3000ml,但是却消耗了1000个瓶子的名字的字节总和的NN的空间,但是如果把1000个瓶子压缩成500或者更少(小文件合并),则可以消耗更少量的NN管理空间。

3.DN(DataNode):存储数据块,存储数据块校验和。


4.SN(SecondaryNode):做每小时的检查工作checkpoint。(检查NN的工作即产生文件fsimage和editlog并进行打包制作成新的fsimage文件保存下来)

图理解:HDFS架构如何设计

以上是“HDFS架构如何设计”这篇文章的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注编程网行业资讯频道!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HDFS架构如何设计

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

HDFS架构如何设计

这篇文章主要介绍HDFS架构如何设计,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!HDFS架构设计:1.NN(NameNode):主要是维护管理文件命名空间,其中包括了文件名称,文件的权限,创建时间,副本数,文件被分
2023-06-03

如何理解kubernetes scheduler架构设计

这期内容当中小编将会给大家带来有关如何理解kubernetes scheduler架构设计,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。资源调度基础scheudler是kubernetes中的核心组件,负
2023-06-19

HDFS分布式文件系统如何设计

这篇文章将为大家详细讲解有关HDFS分布式文件系统如何设计,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。正文HDFS的设计以及概念  HDFS集群是典型的 master/slave 架构,master 节
2023-06-02

系统架构设计师工资待遇如何?

  系统架构设计师是软考的高级资格考试项目,那么系统架构设计师工资待遇如何呢?很多朋友考取系统架构设计师证书就是为了提高自己职业发展中的工资待遇水平,因此系统架构设计师的工资也是很多人关心的问题。  系统架构设计师工资待遇如何?  根据网上一些调查数据显示,系统架构设计师的薪资占比中,8K-10K的人数较多,其次就是6
系统架构设计师工资待遇如何?
2024-04-18

HDFS/HBase技术报告·分布式数据库设计架构的全面解析

Hadoop生态的分布式数据库1、什么是分布式数据库?从狭义的理解就是分布式关系型数据库,主要特指目前热门的NewSQL。从广义的理解,分库分表的传统关系型数据库,传统关系型数据库集群,关系型数据库的主从架构,分布式KV数据库(例如:HBase),分布式文档数
HDFS/HBase技术报告·分布式数据库设计架构的全面解析
2021-06-21

HBase的架构设计如何支持水平扩展

HBase的架构设计通过多种方式支持水平扩展,以处理大规模数据。以下是HBase架构设计中支持水平扩展的关键点:数据分割:HBase表中的数据根据Row Key分割成多个Region,每个Region由一个Region Server管理。随
HBase的架构设计如何支持水平扩展
2024-10-19

如何进行大数据平台架构的设计

本篇文章为大家展示了如何进行大数据平台架构的设计,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。  关于大数据平台架构的设计探究。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面
2023-06-02

MySQL高可用架构设计

MySQL高可用架构设计旨在确保数据库在遭遇故障或维护时仍能保持服务的连续性和数据的完整性。以下是一些常见的高可用架构设计及其特点:MySQL Replication异步复制:主服务器在写入数据后即认为操作完成,而不等待从服务器确认。半
MySQL高可用架构设计
2024-10-20

云服务器架构设计

1.引言云服务器架构设计是构建可靠、高效和可扩展的云计算环境的关键步骤。在设计云服务器架构时,需要考虑到性能、可用性、安全性和成本等因素。本文将介绍一些常见的云服务器架构设计原则和最佳实践。2.弹性扩展弹性扩展是云服务器架构设计的核心原则之一。通过使用自动化工具和服务,可以根据实际需求动态调整服务器资源。这种弹性扩展的
2023-10-27

大型网站的可伸缩性架构如何设计?

1. 网站架构的伸缩性设计1.1. 不同功能进行物理分离实现伸缩纵向分离(分层后分离):将业务处理流程上的不同部分分离部署,实现系统伸缩性。横向分离(业务分割后分离):将不同的业务模块分离部署,实现系统伸缩性。1.2. 单一功能通过集群规模
2023-06-02

Golang开发建议:如何设计可扩展的架构

Golang作为一门现代化的编程语言,在近年来越来越受到开发者的关注和喜爱。它以其优秀的并发能力、高性能和可靠性而闻名。然而,要构建一个可扩展的架构需要额外的考虑和设计。本文将分享一些在Golang开发过程中设计可扩展架构的建议。使用接口在
Golang开发建议:如何设计可扩展的架构
2023-11-22

系统架构设计高级技能 · 大数据架构设计理论与实践

系列文章目录 系统架构设计高级技能 · 软件架构概念、架构风格、ABSD、架构复用、DSSA(一)【系统架构设计师】 系统架构设计高级技能 · 系统质量属性与架构评估(二)【系统架构设计师】 系统架构设计高级技能 · 软件可靠性分析与设计(
2023-08-30

系统架构设计高级技能 · 云原生架构设计理论与实践

系列文章目录 系统架构设计高级技能 · 软件架构概念、架构风格、ABSD、架构复用、DSSA(一)【系统架构设计师】 系统架构设计高级技能 · 系统质量属性与架构评估(二)【系统架构设计师】 系统架构设计高级技能 · 软件可靠性分析与设计(
2023-08-30

MySQL架构设计思想详解

这篇文章主要介绍了MySQL架构设计思想详解,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
2022-11-13

架构设计之“服务限流”

上一篇我们聊过了架构设计中的「服务隔离」模式,今天我们继续来探索一下在分布式系统架构中的另一个常用的设计:服务限流。那么,什么是「服务限流」呢?在解释「服务限流」之前,我们来看一下前些时间网上很火的一个段子,说的是新浪微博的一名工程师正在家
2023-06-05

MySQL Operator 01 | 架构设计概览

高日耀 资深数据库内核研发毕业于华中科技大学,喜欢研究主流数据库架构和源码,并长期从事分布式数据库内核研发。曾参与分布式 MPP 数据库 CirroData 内核开发(东方国信),现主要负责 MySQL 系列产品内核开发(青云科技)。| 背景随着云原生技
MySQL Operator 01 | 架构设计概览
2019-04-16

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录