我的编程空间,编程开发者的网络收藏夹
学习永远不晚

PostgreSQL 12 GA的新特性有哪些

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

PostgreSQL 12 GA的新特性有哪些

本篇内容介绍了“PostgreSQL 12 GA的新特性有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

SQL的执行优化

 
第一个重要的变更重建索引的并行化处理。
 
比如在遇到索引数据损坏、索引膨胀、索引的创建选项变更、无效索引重建等情况,在之前版本中,重建索引需要在表上加全局只读锁,阻止其他会话的写入。而在现在,则通过一个细分的多步事务操作,避免了这个问题,具体如下:
 
1. 首先,是开启事务,创建临时索引。
2. 在临时索引上开始插入数据,这里需要注意的是,如果是重建表上的所有索引,那么这里也会同时创建对应数量的临时索引。
3. 当前一步插入数据完成,再插入创建索引期间产生的新的数据。
4. 所有数据都插入完毕后,使用临时缩影替换掉原先的索引。
5. 最后删除老索引完成整体操作。
 
第二个重要的变更:生成列功能的加入。
 
在数据库的使用中,难免会遇到需要的数据库表的某一列或者某几列使用函数生成的数据。这种时候,如果每次都是实时地进行运算,那么这个计算代价比较大,尤其是表非常大的时候。
 
生成列的出现就是为了解决这个问题。每当数据插入数据库表的时候,对于生成列来说,就会生成其对应的数据,而不需要用户的明确输入,当然实际上用户也无法输入。
 
在PG的实现里面,包含了对生成列的索引的处理。
 
但是目前这个功能的实现也不是万能的,它存在很多的限制。下面我列出其中一些:
 
1. 目前只能实现某一行的计算。
2. 不支持子查询。
3. 不能使用别的生成列。
4. 能用作分区键。
 
第三个重要的变更:优化器层面的处理,即CTE的inline优化。
 
CTE,实际上指的就是with语法指定的在主SQL语句前面的查询,通常会作为临时表提供给主查询结构使用。
 
在之前的实现形态中,执行时候会首先查询出来CTE内的数据作为临时表,然后去对执行主查询对应的操作,而在PostgreSQL 12中,这里进行了名为inline的优化:
如果ctw表达式指定的表,在主查询中制备使用了一次,那么,数据库会直接使用子查询,而非预先查询的方式来执行之后的查询与处理,这里与c等编程语言的inline意味类似。
 
通过子查询进行进一步的优化,可以很大程度地提升性能。
 
这个特性也可以人工控制,对于一些不满足条件的CTE也进行inline处理(MATERIALIZED),或者对满足条件的情况下,依然不使用inline方式处理(NOT MATERIALIZED)。
 
第四个重要的变更:缓存执行计划,目前虽然未见得有多么重要,但在未来,可能会有很大作用的一个功能。
 
众所周知,Oracle是缓存执行计划的,而类似MySQL,PostgreSQL这些开源数据库,都是SQL语句每次现场解析来处理的。而现在,PostgreSQL 12中,首先做到了执行计划的缓存———虽然这个功能影响范围目前十分有限:
目前只有明确使用了prepare语句,创建了临时过程,或者干脆就是存储过程PL/pgSQL,否则无法使用到缓存的执行计划,远远达不到像Oracle那样,普通SQL语句都可以缓存执行计划。
 
但是,可以展望的未来,就势必会有这么一个优化。而这,也将是后续PG的迭代版本需要去做到的事情。
 
第五个重要的变更:实际上是配置的变更,但其主题影响的是SQL执行,因此在这里简单说一下,就是JIT在PostgreSQL 12中,默认是打开的状态。
 
关于JIT,在这里简单描述一下:把SQL语句中的简单计算,直接编译为机器汇编码执行,效率远高于需要从SQL转C调用的普通SQL执行效率,除了需要在SQL解析阶段稍微多一点CPU之外,没有其他坏处,而打开这个特性,获得的好处是巨大的。

配置的优化

除了SQL优化这个开发人员最关心的话题之外,对于运维来说,PG 12这个版本也做到很多的变化。
 
第一个,是新增了两个管理用的视图,以及一个新的函数:
- pg_stat_progress_create_index 查看当前正在创建的索引进度
  • 已经执行的数据块数量

  • 已经执行的行数量

  • 使用/等待锁的情况

- pg_stat_progress_cluster 查看当前vacuum full/cluster进度
  • 数据块读写数量

  • 数据条目读写数量

- pg_ls_archive_statusdir() 列出归档状态文件夹内容
 
这个变化让DBA可以对数据库中发生的重度行为有更详细的了解,以下定更好的决策。
 
第二个,是我认为绝对值得大书一笔,在PG历史上留下精彩篇章的变更:“干掉”recovery.conf文件,配置项目合并入postgresql.conf配置文件。
 
这个文件几乎伴随着PG的出现就已经存在了,在PG 9.0版本之前漫长的年代,这个文件负责了redo(WAL/XLOG)的回放配置,因此叫做recovery.conf。在9.0之后,流复制出现,于是理所当然地,流复制的配置,也被放到这个文件里面了。而后,实际上这个文件更多地扮演者流复制配置而非数据恢复的角色。但是,与数据恢复仅仅需要离线操作不同,流复制在很多时候,是需要有在线变更手段的,而recovery.conf不支持reload,就成了一个需要解决的麻烦事了。
 
在PostgreSQL开始,这个文件原先的项目合并到postgresql.conf之后,为了避免配置冲突,PG自己新增了一个强行的限制:如果检查到数据目录有recovery.conf这个文件,则不允许数据库启动。
 
这个合并,不仅仅是个单纯的合并,也牵扯到很多相关参数的改名以及默认值变更:
 
- 以下参数允许reload
  • archive_cleanup_command

  • promote_trigger_file

  • recovery_end_command

  • recovery_min_apply_delay

- 名称与默认值变更
  • trigger_file 名称变更为promote_trigger_file

  • 取消standby_mode 配置选项

  • 不允许指定多个recovery target

  • 默认恢复到last时间线(之前是current)

  • 使用cluster name作为默认的wal receiver的application name

 
相信未来的后续版本,PG主从切换之后,standby不需要重启就可以变更主库,也不是一件不可能的事情了。
 
第三个,是PG的日常问题,vacuum的优化:
  • 设置VACUUM不回收尾部空白页

  • 设置VACUUM跳过对索引的扫描

  • 设置VACUUM遇到无法立即获取的锁则跳过

 
这些设置当然可以极大程度地减小vacuum对数据库的影响,但对PG的未来来说,更好地解决这个问题的方式,当然是新的存储引擎。

独立存储引擎

就实际来说,MySQL早些年的MyISAM,实现质量并不好,不支持事务,表级别的读写锁。但因为存储引擎独立接口,MySQL等到了InnoDB,InnoDB实现了全套事务存储引擎,且现在已完全取代了MyISAM的地位。
 
而PG本身就实现了事务存储引擎,这个独立存储引擎的需求虽然很多年前早已规划,但实际上拆分出来正经去做,才是这个迭代的事情。
 
目前,PG单独处理了数据存储,索引存储的接口,第三方可以直接实现对应的接口和数据结构,就可以让PG利用到新增的存储引擎。
 
在社区里,已经有两个非常重要的存储引擎产生--虽然距离生成环境尚且还有一段距离,但这两个存储引擎都解决了PG本身存在多年的痼疾,未来可期。
 
两个非常重要的存储引擎,就是EDB的zheap(开发中),以及Greenplum团队共享的zedstore(开发中)存储引擎。
 
首先,说一说zheap。
 
PostgreSQL的存储实现中,其中dirty的一部分,vacuum,在实际生产环境中,成了一个每个运维都必须面对的问题。在zheap中,通过引入undo日志,zheap试图同时解决vacuum问题,以及32位事务id导致的vacuum freeze(事务ID回卷)问题。
 
在zheap中,并没有对heap(后文以此代称“pg”原生存储引擎)的索引,执行计划等进行处理,而只是单纯处理了其数据存储部分,也就是把undo从数据文件剥离出来成为undo日志。
 
目前其实现是:undo日志一直向前写(类似WAL日志),单独的purge进程从undo日志最老的日志开始回收,数据变更会保留在undo日志的数据指针,方便需要查询“老”数据的情况。这么一来,就可以避免数据文件的膨胀,以及vacuum的全表扫描的代价了。
 
而zedstore则代表了不同的方向:OLAP。
greenplum所处理的,就是MPP数据仓库,而在数据仓库来说,通常扫描一个表特定几列的情况,会远多于需要同时扫所有列的情况,因此zedstore设计目的,就是一个列存数据库。
 
zedstore的实现中,每个条目,都有一个名为tid的虚拟主键,表的某一列或者某几列,就保存在使用tid作为主键的B树索引中。通过支持tid到多列的索引,也相当于实现了“行列混合存储”。
 
zedstore另外一个重要的实现,就是压缩。zedstore数据存储的时候,是只压缩数据,不压缩数据块元数据的,这么搞虽然牺牲了一定比例的压缩比(考虑到数据块头的大小,未必有多大代价)。但得到的好处就是显而易见了:数据块以压缩的形态存储在共享池中,由用户会话解压缩各自所需的数据--作为对比的MySQL InnoDB压缩,就是整个数据块级别的压缩,于是共享池里面,就得同时保存数据块的压缩与未压缩版本,平白消耗了宝贵的内存。

“PostgreSQL 12 GA的新特性有哪些”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

PostgreSQL 12 GA的新特性有哪些

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Go1.16的新特性有哪些

本篇内容介绍了“Go1.16的新特性有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!前几天 Go 官方正式发布了 1.16 版本。从这个
2023-06-15

Python3.9的新特性有哪些

这篇文章主要讲解了“Python3.9的新特性有哪些”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Python3.9的新特性有哪些”吧!1. 词典联合运算符这是我最喜欢的功能之一,语法非常优
2023-06-16

Laravel10的新特性有哪些

今天小编给大家分享一下Laravel10的新特性有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。Laravel 10现已
2023-07-05

Java15的新特性有哪些

本篇内容主要讲解“Java15的新特性有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Java15的新特性有哪些”吧!新特性JDK 15 新特性一览表:IDJEPFeature1339Edw
2023-06-16

Kubernetes1.4的新特性有哪些

这篇文章主要介绍“Kubernetes1.4的新特性有哪些”,在日常操作中,相信很多人在Kubernetes1.4的新特性有哪些问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Kubernetes1.4的新特性
2023-06-28

spring4的新特性有哪些

这篇文章给大家介绍spring4的新特性有哪些,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。从Spring4开始,Spring以Servlet3为进行开发,如果用Spring MVC 测试框架的话需要指定Servlet
2023-05-31

es6的新特性有哪些

es6的新特性有:1、块级作用域,可以在块级作用域中声明变量;2、箭头函数,一种新的函数声明方式;3、解构赋值,一种从数组或对象中提取值并赋值给变量的语;4、默认参数,允许在函数定义时为参数提供默认值;5、扩展运算符,可以将数组或对象展开,
2023-08-04

html5有哪些新特性

html5的新特性有:1、语义化标签(hrader、footer等),使得页面的内容结构化,见名知义;2、增强型表单,拥有多个新的表单Input输入类型,可提供更好的输入控制和验证;3、video和audio元素,提供了播放视频和音频文件的标准方法;4、Canvas绘图;5、SVG绘图;6、地理定位;7、拖放API;8、Web Worker;9、Web Storage等等。
2023-05-14

HTML5新特性有哪些

本篇内容主要讲解“HTML5新特性有哪些”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“HTML5新特性有哪些”吧!Web存储 它具有以下特征: 你可以通过属性和方法来使用 JavaScript
2023-06-04

JDK1.5有哪些新特性

本篇内容主要讲解“JDK1.5有哪些新特性”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“JDK1.5有哪些新特性”吧!  1.泛型(Generic)  C++通过模板技术可以指定集合的元素类型,
2023-06-03

编程热搜

目录