SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 -

cwqcwqmax9

浏览: 8627 次
性别:
来自: 南京

最近访客更多访客>>

zzjhmq

odexuce

xialinux

qindongliang1922

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析

博客分类：

oracle

oracle

甲说：
A B两个表总数据量都很大，在百万以上。
idx1 idx2字段表示是索引字段
A B 两表上都有
col1字段表示普通字段

select xxx from A
where A.idx1 between mmm and nnn
     and exists (select 1 from B where B.idx2 = A.col1)

满足A.idx1 between mmm and nnn条件的行一般是几百到几千行，选择性还可以。B表上idx2字段选择性很高。

以前执行计划是 NESTED LOOP-SEMI-JOIN，效率很高。
今天数据库负载突增，最后发现是该语句的执行计划变成 HASH JOIN-SEMI-JOIN，也就意味着对B表进行table access full！

无奈之下，修改查询语句为
... and exists (select /*+ NL_SJ */ 1 from B where...

哪位能指点一下为什么执行计划会变得极差？

乙说：从新分析一下表在查询看看

甲说：
这是未加提示的语句及执行计划，走了HASH JOIN SEMI。[/COLOR]
[PHP]
SQL> explain plan for
2 select count(*)
3    from RECORD_TEMP_A t
4   where 1 = 1
5     and t.datsendtime >= sysdate - 20
6     and t.datsendtime < sysdate - 10
7     AND EXISTS (SELECT 1
8            FROM RECORD_TEMP_B partition(P_MAXVALUE) V
9           WHERE V.MSGID = T.MSGID);

已解释。

SQL> select * from table(dbms_xplan.display());

------------------------------------------------------------------------------------------------------------------
| Id | Operation                             | Name                    | Rows | Bytes | Cost | Pstart| Pstop |
------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                      |                          |     1 |    64 | 17103 |       |       |
|   1 | SORT AGGREGATE                       |                          |     1 |    64 |       |       |       |
|* 2 |   FILTER                              |                          |       |       |       |       |       |
|* 3 |    HASH JOIN SEMI                     |                          | 15167 |   947K| 17103 |       |       |
|   4 |     TABLE ACCESS BY GLOBAL INDEX ROWID| RECORD_TEMP_A            | 22142 |   648K| 10881 | ROWID | ROW L |
|* 5 |      INDEX RANGE SCAN                 | IDX_REC_TEMP_A_SENDTIME | 39856 |       |   464 |       |       |
|* 6 |     TABLE ACCESS FULL                 | RECORD_TEMP_B            |   682K|    22M| 5779 |    24 |    24 |
------------------------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------
省略...

Note: cpu costing is off

已选择22行。
[/PHP]

这是加了NL_SJ提示的语句及执行计划，走了NESTED LOOPS SEMI。[/COLOR]
[PHP]
SQL> explain plan for
2 select count(*)
3    from RECORD_TEMP_A t
4   where 1 = 1
5     and t.datsendtime >= sysdate - 20
6     and t.datsendtime < sysdate - 10
7     AND EXISTS (SELECT /*+ NL_SJ */ 1
8            FROM RECORD_TEMP_B partition(P_MAXVALUE) V
9           WHERE V.MSGID = T.MSGID);

已解释。

SQL> select * from table(dbms_xplan.display());

------------------------------------------------------------------------------------------------------------------
| Id | Operation                             | Name                    | Rows | Bytes | Cost | Pstart| Pstop |
------------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT                      |                          |     1 |    64 | 77307 |       |       |
|   1 | SORT AGGREGATE                       |                          |     1 |    64 |       |       |       |
|* 2 |   FILTER                              |                          |       |       |       |       |       |
|   3 |    NESTED LOOPS SEMI                  |                          | 15167 |   947K| 77307 |       |       |
|   4 |     TABLE ACCESS BY GLOBAL INDEX ROWID| RECORD_TEMP_A            | 22142 |   648K| 10881 | ROWID | ROW L |
|* 5 |      INDEX RANGE SCAN                 | IDX_REC_TEMP_A_SENDTIME | 39856 |       |   464 |       |       |
|* 6 |     TABLE ACCESS BY GLOBAL INDEX ROWID| RECORD_TEMP_B            |   467K|    15M|     3 |    24 |    24 |
|* 7 |      INDEX RANGE SCAN                 | IDX_REC_B_MSGID          |     1 |       |     2 |       |       |
------------------------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):
---------------------------------------------------
省略...

Note: cpu costing is off

已选择23行。

SQL> spool off

乙说：

问题应该在这里
TABLE ACCESS BY GLOBAL INDEX ROWID| RECORD_TEMP_A            | 22142
|* 5 |      INDEX RANGE SCAN                 | IDX_REC_TEMP_A_SENDTIME | 39856 |

这里外表评估的cardinality是错误的，跟楼主说的“满足A.idx1 between mmm and nnn条件的行一般是几百到几千行，选择性还可以”严重不符

内表结果集2万多，外表68万，CBO选择hash join无可厚非

分享到：

同一个Tomcat不同Web应用之间共享会话Sess ...

2013-08-06 00:29
浏览 1967
评论(0)
分类:数据库
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

SEMI-JOIN执行计划突然变成HASH JOIN了 的原因分析

评论

发表评论

相关推荐

oracle undo解析

转载一个 sql优化 （[精华] 一个查询优化的分析调整全过程！很值得一看 ）

最近访客更多访客>>

SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析

转载一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看）