我的编程空间,编程开发者的网络收藏夹
学习永远不晚

SQL性能优化策略之索引优化方法

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

SQL性能优化策略之索引优化方法

SQL优化是优化工作中经常会涉及的问题,由于早期的开发人员往往只关注于SQL功能的实现,而忽略了性能。特别是复杂的SQL,上线之后很少修改,一旦出现问题,即使是当初的开发人员自己也很难理清其中的业务逻辑,需要花费大量的时间去理解代码之间的关系,最终可能还是感觉无从下手。因此开发人员前期应做好代码注释,避免编写过于复杂的SQL语句。本文为大家介绍一些生产环境中真实的常用索引优化方法。

遇到问题SQL时,大家可以根据各自的习惯使用不同的工具(PL/SQL、TOAD等)对SQL进行格式化,我们需要重点关注的是FROM后面的表,以及包含WHERE语句的条件,然后通过awrsqrpt或dbms_xplan获取SQL的详细执行计划和资源消耗信息,业务案例中的SQL语句如下:

  1. SQL> select sum(cggzl) cggzl, sum(qbgzl) qbgzl 
  2.   from (select case 
  3.                  when zlxm_mc like '%2ê3?3£1??ì2é%' then 
  4.                   gzl 
  5.                  else 
  6.                   0 
  7.                end cggzl, 
  8.                case 
  9.                  when zlxm_mc like '%?3±í?÷1ù%' then 
  10.                   gzl 
  11.                  else 
  12.                   0 
  13.                end qbgzl 
  14.           from dictmanage.dict_zl_pro   b, 
  15.                his.pat_inpat_order_info c, 
  16.                pat_inpat_order_cost     d 
  17.          where d.sfxm_id = b.zlxm_id 
  18.            and c.yzjl_id = d.dyzy_yzjl_id 
  19.            and zlxm_mc like '%2???%' 
  20.            and c.yz_zxrq >= to_date(sysdate) 
  21.            and c.yz_zxrq < to_date(sysdate + 1) 
  22.            and d.fy_status in ('1''2'
  23.            and sfxm_je > 0 
  24.            and c.yz_zfrq is null 
  25.            and c.zylsh = :in_zylsh) 

SQL的详细执行计划如图1所示。

图1 SQL执行计划

AWR报告中的资源消耗信息如图2所示。

图2 AWR报告中的资源消耗信息

上述代码所示的业务SQL语句通过三张表进行关联,最终返回的行数为个位数,从执行计划中我们可以看出,Id=0,CBO计算总的COST为123K,其中绝大部分的COST是由Id=10的表pat_inpat_order_cost全表扫描所产生的。此时,我们需要重点关注 pat_inpat_order_cost与其他两张表格的关联情况,where条件中,pat_inpat_order_cost的sfxm_id和dyzy_yzjl_id除了与其他两张表的字段相关联之外,只有fy_status一个过滤条件,下面我们就来看下该列的选择性,代码如下:

  1. SQL> select  
  2.  b.owner, 
  3.  b.table_name, 
  4.  a.column_name, 
  5.  b.num_rows, 
  6.  a.num_distinct Cardinality, 
  7.  ROUND(A.num_distinct * 100 / B.num_rows, 1) selectivity 
  8.   from dba_tab_col_statistics a, dba_tables b 
  9.  where a.owner = b.owner 
  10.    and a.table_name = b.table_name 
  11.    and a.owner = upper('his'
  12.    and a.table_name = upper('pat_inpat_order_cost'
  13.    and a.column_name = upper('fy_status'); 

pat_inpat_order_cost表的字段信息如图3所示。

图3 pat_inpat_order_cost表的字段信息

  1. SQL> select count(*), FY_STATUS 
  2.   from his.pat_inpat_order_cost c 
  3.  group by FY_STATUS; 

fy_status字段列的选择性如图4所示。

图4 fy_status字段列的选择性

由图4可知,fy_status的选择性并不好,而且存在严重倾斜,语句中的固定写法d.fy_status in ('1', '2')几乎包含了所有记录,因此其并不是一个很好的过滤条件。where条件中的大部分过滤条件均来自于C表pat_inpat_order_info,而且C表与D表pat_inpat_order_cost的sfxm_id字段相关联。

整个SQL语句最终返回的行数为个位数,C表通过YZ_ZXRQ_IDX索引范围扫描再回表进行过滤,获取绑定变量值,之后再进一步确认C表返回的行数,代码如下:

  1. SQL> select sql_Id, name, datatype_string, last_captured, value_string 
  2.   from v$sql_bind_capture 
  3.  where sql_id = '18rwad2bgcxfa'

SQL绑定变量值获取情况如图5所示。

图5 SQL绑定变量值获取情况

  1. SQL> select count(*) 
  2.   from his.pat_inpat_order_info c 
  3.  where c.yz_zxrq >= to_date(sysdate) 
  4.    and c.yz_zxrq < to_date(sysdate + 1) 
  5.    and c.yz_zfrq is null 
  6.    and c.zylsh = 72706; 

带入绑定变量我们可以发现,这个查询返回的行数都保持在个位数,如果C表和D表采用嵌套连接的方式,C表能作为驱动表与D表pat_inpat_order_cost相关联,被驱动表只需要在关联列上创建索引,即可大幅提升整个查询的效率,做法其实很简单,只需要在sfxm_id字段上创建索引即可,命令如下:

  1. SQL> create index IDX_SFXM_ID on PAT_INPAT_ORDER_COST (SFXM_ID); 
  2. Plan hash value: 408580053 
  3. ------------------------------------------------------------------------------------------------ 
  4. | Id  | Operation               | Name                 | Rows  | Bytes | Cost (%CPU)| Time     | 
  5. ------------------------------------------------------------------------------------------------ 
  6. |   0 | SELECT STATEMENT        |                      |       |       |    12 (100)|          | 
  7. |   1 |  SORT AGGREGATE         |                      |     1 |    68 |            |          | 
  8. |*  2 |   FILTER                |                      |       |       |            |          | 
  9. |   3 |    NESTED LOOPS         |                      |     1 |    68 |    12   (0)| 00:00:01 | 
  10. |   4 |     NESTED LOOPS        |                      |     1 |    68 |    12   (0)| 00:00:01 | 
  11. |   5 |      NESTED LOOPS       |                      |     1 |    39 |    11   (0)| 00:00:01 | 
  12. |*  6 |       TABLE ACCESS BY GLOBAL INDEX ROWID 
  13.                                 | PAT_INPAT_ORDER_INFO |     1 |    21 |     5   (0)| 00:00:01 | 
  14. |*  7 |        INDEX RANGE SCAN | YZ_ZXRQ_IDX          |     4 |       |     3   (0)| 00:00:01 | 
  15. |*  8 |       TABLE ACCESS BY GLOBAL INDEX ROWID 
  16.                                 | PAT_INPAT_ORDER_COST |     6 |   108 |     6   (0)| 00:00:01 | 
  17. |*  9 |        INDEX RANGE SCAN | IDX_DYZY_YZJL_ID     |     6 |       |     2   (0)| 00:00:01 | 
  18. |* 10 |      INDEX UNIQUE SCAN  | DICT_ZL_PRO_PK       |     1 |       |     0   (0)|          | 
  19. |* 11 |     TABLE ACCESS BY INDEX ROWID | DICT_ZL_PRO  |     1 |    29 |     1   (0)| 00:00:01 | 
  20. ------------------------------------------------------------------------------------------------ 
  21. Predicate Information (identified by operation id): 
  22. --------------------------------------------------- 
  23.    2 - filter(TO_DATE(TO_CHAR(SYSDATE@!+1))>TO_DATE(TO_CHAR(SYSDATE@!))) 
  24.    6 - filter(("C"."ZYLSH"=TO_NUMBER(:IN_ZYLSH) AND "C"."YZ_ZFRQ" IS NULL)) 
  25.    7 - access("C"."YZ_ZXRQ">=TO_DATE(TO_CHAR(SYSDATE@!)) AND "C"."YZ_ZXRQ"
  26.        (SYSDATE@!+1))) 
  27.    8 - filter(("SFXM_JE">0 AND INTERNAL_FUNCTION("D"."FY_STATUS"))) 
  28.    9 - access("C"."YZJL_ID"="D"."DYZY_YZJL_ID"
  29.   10 - access("D"."SFXM_ID"="B"."ZLXM_ID"
  30.   11 - filter("ZLXM_MC" LIKE '%部位%'

创建索引之后,整个执行计划按照我们设想的方式进行,SQL执行时间也从原来的24分钟缩短到1秒,速度提升了上千倍。

上述案例介绍了一种最简单的SQL优化方式,在大多数情况下,我们很难让开发商修改应用,因此索引的优化在SQL优化工作中显得尤为重要。

本文摘编于《DBA攻坚指南:左手Oracle,右手MySQL》,经出版方授权发布。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

SQL性能优化策略之索引优化方法

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

SQL性能优化策略之索引优化方法

SQL优化是优化工作中经常会涉及的问题,由于早期的开发人员往往只关注于SQL功能的实现,而忽略了性能。特别是复杂的SQL,上线之后很少修改,一旦出现问题,即使是当初的开发人员自己也很难理清其中的业务逻辑,需要花费大量的时间去理解代码之间的
SQL索引性能2024-12-03

SQL性能优化策略之联合索引优化方法

LIS_REQUISITION_INFO表的访问先通过I_PRINT_TIME索引进行范围扫描,符合条件的记录回表之后再过滤,产生了大量的单块读。
SQL策略优化2024-12-03

MySQL高性能索引策略和查询性能优化

前缀索引和索引选择性有时候需要索引很长的字符,这会让索引变得大且慢。一个策略是模拟哈希索引。通常可以索引开始的部分字符,这样可以大大解约索引空间,提高索引效率。但这样会降低索引的选择性。索引的选择性:不重复的索引值(也成为基数)和数据表的记录总数比值。索引的选
MySQL高性能索引策略和查询性能优化
2017-05-17

Tomcat:性能优化策略

学习优化的原则提供给大家优化思路,没有说有明确的参数值大家直接去使用,必须根据自己的真实生产环境来进行调整,调优是一个过程。

MongoDB索引策略与优化的方法是什么

MongoDB的索引策略和优化方法包括以下几个方面:选择合适的字段建立索引:根据查询需求和数据访问模式选择需要建立索引的字段,可以是单个字段或者组合字段。避免创建过多的索引:过多的索引会增加写入操作的开销,并占用额外的存储空间,同时也会增加
MongoDB索引策略与优化的方法是什么
2024-05-07

Oracle数据库索引优化策略

确保正确选择索引类型:在创建索引时,需要根据查询的需求选择合适的索引类型,如普通索引、唯一索引、组合索引等。确保索引覆盖查询:尽量让索引覆盖查询,即查询中涉及的字段都包含在索引中,减少不必要的字段扫描,提高查询效率。避免对频繁更新的字段建立
Oracle数据库索引优化策略
2024-08-15

Mysql性能优化之索引下推

索引下推(index condition pushdown )简称ICP,在Mysql5.6的版本上推出,用于优化查询。 在不使用ICP的情况下,在使用非主键索引(又叫普通索引或者二级索引)进行查询时,存储引擎通过索引检索到数据,然后返回给
2022-05-19

MySQL性能优化,MySQL索引优化,order by优化,explain优化

今天我们来讲讲如何优化MySQL的性能,主要从索引方面优化。

PHP与MySQL索引的查询语句优化和索引返回的性能优化策略及其对性能的影响

数据库是现代应用开发中不可或缺的一部分,而针对数据库的查询语句优化和索引返回的性能优化是开发人员应该重点关注的问题。索引是一种用于提高数据库查询效率的重要数据结构,它通过在表中创建特定字段的索引来加速数据的查找和排序过程。本文将重点讨论PH
2023-10-21

SQL语句性能优化的策略有哪些

这篇文章主要介绍“SQL语句性能优化的策略有哪些”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“SQL语句性能优化的策略有哪些”文章能帮助大家解决问题。52 条 SQL 语句性能优化策略:1、对查询进
2023-06-28

优化网站性能的有效方法和策略

随着互联网的普及和发展,网站已经成为企业宣传和营销的重要渠道之一。然而,随着网站访问量的不断增加,网站性能的问题也逐渐暴露出来。网站打开速度慢、页面加载时间长等问题不仅影响用户体验,也会导致流量流失和转化率下降。为了提升网站性能,吸引用户,
优化网站性能的有效方法和策略
2024-02-02

Vite性能优化之分包策略的实现

本文主要介绍了Vite性能优化之分包策略的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
2023-05-19

MySQL数据库全文索引优化策略

MySQL数据库全文索引是用于加速文本搜索的一种索引类型。为了优化全文索引的性能,可以采取以下策略:选择合适的字段创建全文索引:全文索引适用于大量文本数据的字段,如文章标题、摘要、内容等。在选择创建全文索引的字段时,应确保这些字段的数据量足
MySQL数据库全文索引优化策略
2024-10-21

MyBatis ORM的查询优化与索引策略

MyBatis ORM的查询优化与索引策略是提升数据库性能的关键。以下是一些优化查询和索引策略的方法:查询优化动态SQL:利用MyBatis的动态SQL功能,根据不同的条件生成不同的查询语句,避免生成冗余的SQL语句。分页查询:对于大数
MyBatis ORM的查询优化与索引策略
2024-09-11

PHP接口性能优化之并发处理策略(PHP接口中并发处理的性能优化方法)

PHP接口性能优化之并发处理策略PHP接口中可通过并发处理提高性能,采用非阻塞异步处理、多进程、多线程、协程、消息队列等策略。优化网络请求、使用负载均衡,并进行性能监控和分析,可进一步提升表现。实施这些策略能显著降低响应时间、提高吞吐量。
PHP接口性能优化之并发处理策略(PHP接口中并发处理的性能优化方法)
2024-04-02

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录