我的编程空间,编程开发者的网络收藏夹
学习永远不晚

数据库常用的压缩算法有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

数据库常用的压缩算法有哪些

数据库常用的压缩算法有哪些,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

  数据库常用的压缩算法怎么解读

  最早的列式数据库Sybase IQ 使用的是一种Decomposed 模型, 简单的将每一列分开,然后用rowid 来标记每一行的位置。

  后来的列式数据库基本上都不用rowid 来标记每一列的位置, 并且对于每一个Block 的数据一定是先计算那一列具有最高选择性(唯一值最少),然后依次以选择性来排序从而可以不使用rowid 标记行的位置。

  而由于排序之后相同的值在一起的机会更大,所以压缩率也就比普通的简单列储存(也即上面介绍的Decompose模型) 的压缩率大很多倍。

  常见的列式数据库压缩算法有如下几种:

  当 数据排序之后相同的值肯定在一起,并且在同一个Block 里面一个值压缩后只会出现一遍。 注意这里的排序并不是指按照值大小的排序,比如5>1 , B>A 这种,而是值将相同的值聚在一起,按出现的频率进行排序( 类似group by 之后order by 每一个字段)。 比如:

  WWWWWWWWWWWWWWBBBBBBBBBZZZZZA1

  压缩后就成为

  W14B9Z5A1

  按照出现的频率进行先后顺序排序。 只要计算每一个数值出现的次数就可以计算出当前数值的起始rowid 和次数了。 这比较有利于进行in , not in , group 等sql 操作。

  将每一个出现的值写在Block 的头部, 然后用1 和 0 来表示有或者没有。 这种算法要求每一个出现的值都必须具有非常高的选择性并且不同值之间差别不能大到几十倍的差距,而不像Run Length Encoding 只需要整体的选择性比较高就可以了。

  数据库常用的压缩算法怎么解读

  行式数据库的BitMap Index 一般是一个整体的文件块(如果是local partition 当然也是local index)。 列式数据库的组织形式都是按每一个block 每一个block 的方式组织,它的bitmap index 出现的值都是按当前block 出现的所有值组织的。 某些列式数据库会有一些变种: 比如在1和 0 之间还加入Run length encoding 继续压缩或者加入Null Compression, 用来排除空值比较多的情况。

  Data Dictionary

  行 式数据库的一般都是选用的这种方式,将Block 常用的值放在block 头部, 实际出现这个值的地方用标记代替,行式数据库里面一般会有一个压缩级别的东西,压缩级别越高压缩时间越长,收益越小,解压缩时间不变。 列式数据库的Data Dictionary 压缩也是在block 的头部存放压缩之前的实际值,但是与行式数据库不同的是列式数据库会存放所有值,不管这个值即使只出现了一次,这样便于它在不可见索引和延迟物化方面可以 不解压数据就能进行普通操作。

  Delta Compression

  delta压缩适合在那些数据前半部分相同的情况下使用,比如很大的整数和长的有规律的字符串。 Delta 压缩会记录一个基础值,然后在之后的每一个值只使用他们差别的部分,比如电话号码,URL,地址,IP 之类的。

  LZO

  LZO或者其他类似的二进制压缩算法gzip,zip,rar,7zip。bzip等等在列数据库里面也有使用,但是只适用于连读取都非常少的归档数据(每次只读非常少量的行数)和大段的文本(网页索引之类的)。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注亿速云行业资讯频道,感谢您对亿速云的支持。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

数据库常用的压缩算法有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Cassandra中的压缩算法有哪些

在Cassandra中,压缩算法通常用于压缩 SSTable 文件以减少存储空间和提高读取性能。以下是一些常用的压缩算法:Snappy:Snappy 是一种快速的压缩算法,它提供了快速的压缩和解压缩速度,并且占用相对较少的 CPU 资源。S
Cassandra中的压缩算法有哪些
2024-04-09

Linux系统有哪些常用的压缩解压方法

本篇内容介绍了“Linux系统有哪些常用的压缩解压方法”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!.tar解包: tar xvf File
2023-06-10

linux压缩常用命令有哪些

这篇文章主要为大家展示了“linux压缩常用命令有哪些”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“linux压缩常用命令有哪些”这篇文章吧。 tar-c: 建立压缩档案-x:解压-t:查看内容
2023-06-09

Linux中常用的压缩命令有哪些

这篇文章将为大家详细讲解有关Linux中常用的压缩命令有哪些,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。打包是指将多个文件或者目录放在一起,形成一个总的包,这样便于保存和传输,但是大小是没有变化的,压缩
2023-06-28

如何使用PHP进行文件的压缩和解压缩?(PHP中实现文件压缩和解压缩的常用库有哪些?)

本文介绍了使用PHP进行文件压缩和解压缩的方法,包括常用库及其优缺点。Zlib:轻量级,语法简单,提供gzip和deflate算法。BZip2:压缩率更高但速度较慢,需要PHP扩展。7-Zip:第三方库,提供各种算法,压缩率最高但速度最慢。其他库:如Phar、Rar、Tar和Gzip。选择库应考虑压缩率、速度、易用性和文件格式支持。最佳实践包括选择合适库、权衡压缩率和速度、解压缩前使用压缩文件以及妥善处理压缩文件。
如何使用PHP进行文件的压缩和解压缩?(PHP中实现文件压缩和解压缩的常用库有哪些?)
2024-04-02

HBase中数据压缩的方式有哪些

HBase中数据压缩的方式主要有以下几种:Gzip压缩:Gzip是一种通用的数据压缩算法,可以有效地减小数据的大小,节省存储空间。在HBase中,可以通过配置hbase.hregion.memstore.chunkpool.maxsize参
HBase中数据压缩的方式有哪些
2024-03-11

HBase中的数据压缩技术有哪些

HBase中的数据压缩技术包括以下几种:Gzip:Gzip 是一种通用的数据压缩格式,可以在 HBase 中使用来减少存储空间的占用。Snappy:Snappy 是一种快速压缩和解压缩算法,可以在 HBase 中用于数据压缩,可以提高读取和
HBase中的数据压缩技术有哪些
2024-03-06

webpack中常用的JS压缩插件有哪些

这篇文章给大家分享的是有关webpack中常用的JS压缩插件有哪些的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。这里 讲解 三种JS 打包插件:(1)UglifyJS支持: babel present2015、w
2023-06-14

Linux中有哪些压缩格式的压缩与解压方法

Linux中有哪些压缩格式的压缩与解压方法?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。什么是Linux系统Linux是一种免费使用和自由传播的类UNIX操作系统,是一个基于P
2023-06-09

有关VS2003压缩代码的常识有哪些

这篇文章给大家介绍有关VS2003压缩代码的常识有哪些,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。1、首先从这里下载0.84版本的VS2003压缩代码及示例码。2、下载下来之后你发现它没有VS2003的解决方案文件,
2023-06-17

常见的压缩文件格式有哪些

常见的压缩文件格式包括:1. ZIP格式(.zip):最常见的压缩格式之一,可在多个操作系统和软件中使用。2. RAR格式(.rar):一种常用的高压缩比格式,可将文件压缩到较小的大小。3. 7Z格式(.7z):一种高压缩比的文件格式,通常
2023-06-11

Android常见的图片压缩方式有哪些

小编给大家分享一下Android常见的图片压缩方式有哪些,希望大家阅读完这篇文章之后都有所收获,下面让我们一起去探讨吧!先给出一组数据原图:width:2976; height:2976原图实际:--->byte:2299820 Mb:2.
2023-06-15

编程热搜

目录