我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HBase简介

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HBase简介

一、简介

   HBase是基于列存储、构建在HDFS上的分布式存储系统,其主要功能是存储海量结构化数据。

   HBase简介


   HBase构建在HDFS之上,因此HBase也是通过增加廉价的PC机提高系统运行和存储的能力。

   HBase中存储的表有如下特点:

1、大表:一个表可以有数十亿行,上百万列;

2、无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中不同的行可以有截然不同的列;

3、面向列:面向列(族)的存储和权限控制,列(族)独立检索;

4、稀疏:对于空(null)的列,并不占用存储空间,表可以设计的非常稀疏;

5、数据多版本:每个单元中的数据可以有多个版本,默认情况下版本号自动分配,是单元格插入时的时间戳;

6、数据类型单一:Hbase中的数据都是字符串,没有类型。


二、hbase的适用场景

  1、存在高并发读写

  2、表结构的列族经常需要调整

  3、存储结构化或半结构化数据

  4、高并发的key-value存储

  5、key随机写入,有序存储

  6、针对每个key保存一个固定大小的集合  多版本

    同样hbase数据也存在不适用的场景

  1、由于hbase只能提供行锁,它对分布式事务支持不好

  2、对于查询操作中的join、group by 性能很差

  3、查询如果不使用row-key查询,性能会很差,因为此时会进行全表扫描,建立二级索引或多级索引需要同时维护一张索引表

  4、高并发的随机读支持有限

三、hbase基本架构及组件说明

HBase简介

    由上图可知,hbase包括Clinet、HMaster、HRegionServer、ZooKeeper组件

    各组件功能介绍:

    1、Client

        Client主要通过ZooKeeper与Hbaser和HRegionServer通信,对于管理操作:client向master发起请求,对于数据读写操作:client向regionserver发起请求

    2、ZooKeeper

        zk负责存储_root_表的地址,也负责存储当前服务的master地址,regsion server也会将自身的信息注册到zk中,以便master能够感知region server的状态,zk也会协调active master,也就是可以提供一个选举master leader,也会协调各个region server的容灾流程

    3、HMaster

        master可以启动多个master,master主要负责table和region的管理工作,响应用户对表的CRUD操作,管理region server的负载均衡,调整region 的分布和分配,当region server停机后,负责对失效的regionn进行迁移操作

    4、HRegionServer

        region server主要负责响应用户的IO请求,并把IO请求转换为读写HDFS的操作


免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HBase简介

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

2024-04-02

MongoDB(一):NoSQL简介、MongoDB简介

1. NoSQL简介1.1 什么是NoSQLNoSQL(NoSQL= Not Only SQL),意即“不仅仅是SQL",是一项全新的数据库理念,泛指非关系型的数据库。1.2 为什么需要NoSQL随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极
MongoDB(一):NoSQL简介、MongoDB简介
2019-07-31

python 调用HBase的简单实例

新来的一个工程师不懂HBase,java不熟,python还行,我建议他那可以考虑用HBase的thrift调用,完成目前的工作。 首先,安装thrift 下载thrift,这里,我用的是thrift-0.7.0-dev.tar.gz 这个
2022-06-04

Elasticsearch简介

疫情已经持续了好几个月了,作为程序员滴我们也帮不上什么忙,只有老老实实呆在家里或者出门一定戴口罩准守一些规则,不给国家添乱。不过最近疫情开始有所扭转,但是还是对国家经济,对企业业务造成了很大的影响,我也被停止了实习。接下来,可能会面临着失业,破产等等严肃的问题
Elasticsearch简介
2014-08-14

VMotion简介

源起:
2023-06-04

MySQL简介

MySQL介绍:简介、特点与应用示例概述:MySQL是当前最常用的关系型数据库管理系统之一。作为一个开源的数据库管理系统,MySQL具有许多优点,如高性能、可靠性强以及易于使用等。本文将介绍MySQL的特点以及应用场景,并附上相关代码示例
MySQL简介
2024-02-22
2023-10-11

HBase详细介绍及原理解析!

Apache HBase 是 Hadoop中一个支持分布式的、可扩展的大数据存储的数据库。当需要对大数据进行随机、实时读/写访问时,可以用 Apache HBase。
Hadoop数据库2024-11-30

Hive简介

1.1  Hive简介1.1.1 什么是HiveHive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。1.1.2 为什么使用Hive直接使用hadoop所面临的问题人员学习成本太高项目周期要求太短Map
Hive简介
2019-06-16

Redis 简介

Redis 特性     1.速度快       官方给出的数字是读写性能可以达到10万/秒,当然这也取决于机器的性能。大致归纳速度快的四点原因如下:             # Redis 的所有数据都是放在内存中的,这也是最主要的原因;          
Redis 简介
2021-08-02

Cassandra 简介

Cassandra是云原生和微服务化场景中最好的NoSQL数据库。我信了~ 1. Cassandra是什么高可用性和可扩展的分布式数据库Apache Cassandra™是一个开源分布式数据,可提供当今最苛刻的应用程序所需的高可用性、高性能和线性可伸缩性。它提
Cassandra 简介
2015-01-20
2023-09-01
2023-09-03

python简介

Python是一种开源的面向对象编程语言随着人工智能与大数据分析的火热,python也随之火热起来Python应用广泛,特别适用以下几个方面1.系统编程:提供API(Application Programming Interface,应用程
2023-01-30

Python 简介

Python介绍与特点(自学python知识整理)Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python 的设计:Python 是一种解释型语言: 这意味着开发过程中没有了编译这个环节。类似于PHP和Pe
2023-01-31

IPv6简介

IPv6仅仅只是“长”吗?IPv6的地址长什么样?平时我们是怎么使用IPv6的呢?编写网络程序的时候要怎么处理IPv6?且待本篇一一道来。为什么需要IPv6?全球的IP地址由一个名字叫IANA(Internet Assigned Numbe
2023-01-31

编程热搜

目录