加入收藏 | 设为首页 | 会员中心 | 我要投稿 温州站长网 (https://www.0577zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 服务器 > 安全 > 正文

一个SQL语句引发的ORA-00600错误排查

发布时间:2021-01-08 20:43:55 所属栏目:安全 来源:网络整理
导读:副标题#e# 《一个SQL语句引发的ORA-00600错误排查》要点: 本文介绍了一个SQL语句引发的ORA-00600错误排查,希望对您有用。如果有疑问,可以联系我们。 作者介绍 杨建荣,【DBAplus社群】联合发起人.现就职于搜狐畅游,Oracle ACE-A、YEP成员,超7年数据库开发
副标题[/!--empirenews.page--]

《一个SQL语句引发的ORA-00600错误排查》要点:
本文介绍了一个SQL语句引发的ORA-00600错误排查,希望对您有用。如果有疑问,可以联系我们。

作者介绍

杨建荣,【DBAplus社群】联合发起人.现就职于搜狐畅游,Oracle ACE-A、YEP成员,超7年数据库开发和运维经验,擅长电信数据业务、数据库迁移和性能调优.持Oracle 10G OCP,OCM,MySQL OCP认证,《Oracle DBA工作笔记》作者.

Merge是从Oracle 9i就引入的功能,它是有别于其他DML中的一种特殊语句,类似于MySQL中的 insert into on duplicate key操作,而且Merge功能更丰富,可以同时对一个表中的数据进行insert和update操作,原本需要存储过程实现的工作现在用一条SQL语句就可以做到.确实很有亮点,从我的感觉来看,它带来的问题实在是不少,当然有不少是特定版本的特定问题.

比如最近有一个同事问我一个问题,他运行一个SQL语句抛出了ORA-00600的错误,想让我帮忙分析一下,我了解了问题的大体情况之后,发现值得好好琢磨一番,因为只是客户端调用抛出异常,没有给服务器端带来什么致命的影响,而且这个语句只是通过客户端工具测试所用,还没有正式部署,这样就给我分析问题带来了不少的时间和空间.

1问题描述

简单沟通后,我得到了同事提供的SQL语句和执行环境(数据库版本是11.2.0.3),语句类似下面的形式:

这样一个语句看起来结构挺复杂,但是细看逻辑倒不复杂.最近处理了不少性能问题,很多都是和Merge的使用有关,这次是不是又中招了呢,带着疑问来看这个语句,初步的感觉是绑定变量真是多.

这个问题带给我的最大福利就是能够复现,这一点真是非常难得,有很多的ORA-00600错误复现需要上下文环境触发一定的条件才可以复现,可遇不可求,就像前些天社群的一篇文章《腾讯高级工程师:一道面试题引发的高并发性能调试思考》,需要动用大量的技巧来复现分析,可能是一个平均运行一百万次才出现一次的bug.而这个问题让我省了不少事,在alert日志中也发现了对应的trace文件,但是从里面得到的信息着实有限.

2复现问题

我没有花太多时间在这个trace上,转而尝试去复现这个问题,首先我通过v$sql去数据库中查看这个SQL语句,结果查找的很仔细,竟然没有任何的信息,仿佛这个语句没有执行过一般,所以这个语句在解析时就出了问题.

然后我切换到属主用户下,尝试生成执行计划.庆幸的是这个时候问题可以复现出来了.

由此可见,这个语句在SQL解析的时候就会抛出问题.对于这个报错,在MetaLink上进行一番查找,发现相关的bug还真不少,锁定了一个较为符合的bug.

这是和执行Merge相关的,出现的版本是11.2.0.3,查看里面的解释,就是打补丁,没有其它的解决方法.

其实对于ORA-00600的错误,就类似开发中的NULLPointerException,这类问题的边界比较模糊,排查需要花费一些精力,有的时候还需要一些运气.

3初步结论

我的初步感觉就是问题可能在两个方面.

  1. 一个是TEST_SERVER_LOG这个表数据量非常大,是否在Merge中有一定的影响导致
  2. 语句中含有大量的绑定变量,是否绑定变量数过多导致了Merge的支持出现了问题

于是我朝着这个方向进行了分析和排查.我逐个替换了绑定变量,把它暂时替换为常量,发现错误依旧出现,只是错误的参数部分会有下标的变化.

直到我把整个using部分的绑定变量全部替换掉,竟然抛出了一个看起来不大相关的错误.

看这个问题,是字段不存在,仔细查看源表中的字段信息,发现确实如此,我是如获至宝,好像定位到了问题的原因.

但是经过确认,原来这个表的属主是另外一个,切换了开发同学使用的用户之后,语句就可以正常解析了,问题的原因是什么呢?

我们可以通过下面这个语句来说明,在没有绑定变量的情况下解析会正常通过.

所以这个时候就比较纠结,很多应用场景都是需要使用绑定变量的,所以尽管如此,这不是一个通用的解决方法.然后我尝试在using子句中添加一个绑定变量,ORA-00600问题再次出现,可见二十多个绑定变量和一个绑定变量都会出现同样的问题.

所以一个初步结论是,这个错误和绑定变量还是有一定的关系,但是具体原因还无法定位.
那么这个问题是否和数据量有关呢.经过确认,这个相关表TEST_SERVER_LOG的数据量情况如下,只有一行数据.

所以可以证明,这个bug和TEST_SERVER_LOG的数据量无关,绑定变量的部分还得进一步确认,目前暂时无法定位.

我们再来看看trace文件中的内容:

SQL运行时抛出的错误为

那么qcsfbdnp代表什么含义呢,可以在trace文件中找到一些答案.

报错编码是[qcsfbdnp:1],[7],[],[2],? 这个代表的含义在这个日志中可以看到是在SQL解析器的部分调用出现了问题.

(编辑:温州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读