我的编程空间,编程开发者的网络收藏夹
学习永远不晚

记一次ORA-00600 kdsgrp1处理

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

记一次ORA-00600 kdsgrp1处理

    一日, 客户的数据库中表空间SYSAUX的AWR相关表出现了一个坏块。通过truncate表(数据不重要),从备份中restore数据文件,做完恢复之后坏块修复。

   数据库OPEN之后,客户业务出现错误。检查告警日志,出现了:
  

  Errors in file /u01/app/oracle/diag/rdbms/test/test/trace/test_ora_51465.trc  (incident=279339):

  ORA-00600: 内部错误代码, 参数: [kdsgrp1], [], [], [], [], [], [], [], [], [], [], []

  Incident details in: /u01/app/oracle/diag/rdbms/test/test/incident/incdir_279339/test_ora_51465_i279339.trc

  从trace中看出,某个SQL引发了这个错误。这个错误主要指对应索引ROWID,在数据表中找不到记录,这表明出现了数据一致性问题。从trace文件中获得了引发错误的SQL,执行之,如下:

   记一次ORA-00600 kdsgrp1处理


继续看trace文件, 可以定位到如下记录

*** 2019-03-30 22:00:06.323

*** SESSION ID:(1802.759) 2019-03-30 22:00:06.323

*** CLIENT ID:() 2019-03-30 22:00:06.323

*** SERVICE NAME:(ysnc) 2019-03-30 22:00:06.323

*** MODULE NAME:(sqlservr.exe) 2019-03-30 22:00:06.323

*** ACTION NAME:() 2019-03-30 22:00:06.323

 

* kdsgrp1-1: *************************************************

            row 0x030b33a7.0 continuation at

            0x030b33a7.0 file# 12 block# 734119 slot 0 not found

KDSTABN_GET: 0 ..... ntab: 0

curSlot: 0 ..... nrows: 0

kdsgrp - dump CR block dba=0x030b33a7

Block header dump:  0x030b33a7

 Object id on Block? Y

 seg/obj: 0x29761  csc: 0x00.53475f8c  itc: 2  flg: E  typ: 1 - DATA

     brn: 0  bdba: 0x30b3300 ver: 0x01 opc: 0

     inc: 0  exflg: 0

从中,得到了数据文件号12, 以及数据块编号, 734119, 可以使用SQL定位出错的对象

 select owner,segment_name,segment_type from dba_extents where file_id= 12 and block_id<= 734119  and (block_id+blocks)>= 734119 ;


查询到了对象之后,开始尝试重建对象的索引。

记一次ORA-00600 kdsgrp1处理

重建时,出现了错误ORA-00600 13004。 

只得通过drop索引,然后再create的办法建立。

索引重建完成后,此SQL再次执行,没有发生错误。


另外,此客户的数据库后来又发生了ORA-08103 Object no longer exists

查询表时,已经发生错误,这里就不可避免发生了数据丢失。

从MOS上查到了如下脚本抢救数据:

REM Create a new table based on the table that is producing errors with no rows:


create table <用户>.(表名>_20180331

as

select * 

from   <用户>.(表名>

where  1=2;


REM Create the table to keep track of ROWIDs pointing to affected rows:


create table <用户>.bad_rows (row_id rowid, oracle_error_code number);


set serveroutput on


DECLARE

  TYPE RowIDTab IS TABLE OF ROWID INDEX BY BINARY_INTEGER;


  CURSOR c1 IS select rowid

  from <用户>.(表名> tab1

  where pk_flow is NOT NULL

  order by rowid;


  r RowIDTab;

  rows NATURAL := 20000;

  bad_rows number := 0 ;

  errors number;

  error_code number;

  myrowid rowid;

BEGIN

  OPEN c1;

  LOOP

   FETCH c1 BULK COLLECT INTO r LIMIT rows;

   EXIT WHEN r.count=0;

   BEGIN

    FORALL i IN r.FIRST..r.LAST SAVE EXCEPTIONS

     insert into <用户>.(表名>_20180331

     select a.*

     from <用户>.(表名> A where rowid = r(i);

   EXCEPTION

   when OTHERS then

    BEGIN

     errors := SQL%BULK_EXCEPTIONS.COUNT;

     FOR err1 IN 1..errors LOOP

      error_code := SQL%BULK_EXCEPTIONS(err1).ERROR_CODE;

      if error_code in (1410, 8103, 1578) then

       myrowid := r(SQL%BULK_EXCEPTIONS(err1).ERROR_INDEX);

       bad_rows := bad_rows + 1;

       insert into <用户>.bad_rows values(myrowid, error_code);

      else

       raise;

      end if;

     END LOOP;

    END;

   END;

   commit;

  END LOOP;

  commit;

  CLOSE c1;

  dbms_output.put_line('Total Bad Rows: '||bad_rows);

END;


万幸的是, 40多万条数据最终只丢失了6条,收到影响的单据有两个。业务通过补单据的方式挽回了数据。


参考:  http://www.eygle.com/archives/2011/07/ora-600_kdsgrp1.html

         文档 ID 1527738.1

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

记一次ORA-00600 kdsgrp1处理

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

记一次JVM内存溢出的处理过程

概要笔者所管理的测试一台业务服务器,近期经常被反馈应用卡顿并且出现过多次内存溢出,本篇为对此问题的处理过程的记录。服务器环境采用Oracle JDK1.6,虚拟机为HosSpot,Web容器为Tomcat7。处理过程获取堆内存转储快照在用户
2023-06-02

记一次线上服务CPU 100%的处理过程

告警正在开会,突然钉钉告警声响个不停,同时市场人员反馈客户在投诉系统登不进了,报504错误。查看钉钉上的告警信息,几台业务服务器节点全部报CPU超过告警阈值,达100%。赶紧从会上下来,SSH登录服务器,使用 top 命令查看,几个Java进程CPU占用达到1
2019-08-04

一次mysql的.ibd文件过大处理过程记录

一条zabbix微信的磁盘告警打破了往常的宁静收到告警之后发现是mysql的datadir目录,按着平时习惯开始排查;过程就不说了,最后发现某个库的目录大小异常,然后进去查看之后发现jdp_tb_trade.ibd过大,达到46G;跟真实
2022-06-29

sql处理笔记(一)

修改手机号码尾缀: update yqsys_person set mobile = case when POSITION("." in mobile) > 0 then SUBSTRING_INDEX(mobile,".",1) else mobile en
sql处理笔记(一)
2021-12-01

ORA-16099: internal error ORA-00600 occurred at standby database ORACLE 报错 故障修复 远程处理

文档解释ORA-16099: internal error ORA-00600 occurred at standby databaseCause: The RFS process on the standby database
ORA-16099: internal error ORA-00600 occurred at standby database ORACLE 报错 故障修复 远程处理
2023-11-05

软考信息处理技术员一年考一次还是两次?

针对考生关于软考信息处理技术员一年考一次还是两次?软考信息处理技术员一年考几次?的疑惑,希赛小编将软考信息处理技术员考试次数及考试科目等相关资讯信息整理如下:一、信息处理技术员考试次数根据近几年软考信息处理技术员的考试安排来看,信息处理技术员原本一年有两次考试,但是2024年软考改革,2024年的信息处理技术员考试只在
软考信息处理技术员一年考一次还是两次?
2024-04-02

记录一次Oracle启动后几分钟自动Down机的处理过程

1.观察问题情况查找Oracle异常,通过alert日志观察。alert日志路径参考如下:startup mount;SQL> show parameter backNAME TYPE VALUE----------------------------
记录一次Oracle启动后几分钟自动Down机的处理过程
2017-06-06

信息处理技术员每年考一次还是两次

  两次。软考信息处理技术员每年安排两次考试。软考每年上半年和下半年的开考资格安排会有所不同,有些资格一年考两次,有些资格一年考一次,考生可以根据每年的考试计划安排报名。  软考信息处理技术员每年安排两次考试。软考各级别包含多个资格考试,其中有些资格一年考两次,而有些资格一年考一次,也就是说有些资格上半年和下半年都会考
信息处理技术员每年考一次还是两次
2024-04-18

编程热搜

目录