`
keepwork
  • 浏览: 325038 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

Oracle--三种连接方法(哈希连接、嵌套连接、笛卡儿乘积)

 
阅读更多
开发者博客www.developsearch.com
 
数据库系统中执行一个查询SQL语句,如果这个查询只操作一张表,那么仅仅涉及到这个表及关联对象的访问。
访问方式通常是三种:全表扫描、全索引扫描和索引扫描。
如果这个查询操作两张及以上的表,那么需要操作的表之间的连接关系就变得至关重要。
数据库系统执行该SQL时,永远都是两个结果集关联。
 
例如,
操作三张表,那么就是其中两张表关联出一个结果集,和第三张表关联。
操作四张表,那么就是其中两张表关联出一个结果集,和第三张表关联出一个结果集,再和第四张表关联出最后的结果集。当然也可能是两两关联出两个结果集,再相互关联得到最后的结果集。
操作五张表,各个表之间的关联方式就更复杂了。
 
这些描述就是数据库系统用来根据操作表的不同排列和组合而生成不同的执行计划。
Oracle数据库系统会使用一种机制,来决定哪一种组合性能最好。这种机制称为基于成本的优化器(Cost-Based Optimization,简称为CBO)。
 

---------------------------------------------嵌套连接

  嵌套循环,顾名思义就是将一个表为出发点,将该表全部记录逐条去遍历另外一张表的记录,符合条件的就是写入结果集。

 基于嵌套连接的特点,我们可以想得到,它在两个关联表的数据量相差比较大时采用,但整体上数据量都不应该太大。
 该关联方式适用于得到小数据量的查询操作。


 
例1:
使用leading与use_n1来强制使用嵌套循环连接
leading提示要求先访问表t1,也就是它指定了哪张表作为外部循环表使用
use_nl提示指定了具体使用哪种连接方法来将内部循环返回的数据(表t2)与表t1连接起来
有必要指出的是:use_nl提示并没有引用t1
SELECT /*+ leading(t1) use_nl(t2) full(t1) full(t2) */*
FROM t1,t2 WHERE t1.id = t2.id AND t1.n = 19
执行计划如下:

 

 
 

 

 

 

 

 

 

 

 
 
 
例2:
select a.*, b * 
from EMP a, DEPT b 
where a.DEPTNO = b.DEPTNO;
如使用emp表为出发点,将emp表的记录都查询出来为m条,再将这m条记录的字段deptno值,逐条和dept表的所有记录的deptno字段值匹配,假如dept表有n条记录。
匹配出来的记录符合条件就写入到结果集中。
那么这样关联操作过程中,操作的记录条数就是:先是emp表的m条,接着是dept表n条,但查了m遍,总的记录数就是m+m*n。
如使用dept表为出发点,去遍历emp表,那么总的记录数就是n+n*m。
出发点不同的连接方法,需要的成本就是不一样的。CBO会去最小的那个。

 

使用伪代码来表示一下嵌套循环连接

declare
begin
  for outer_table in (select * from emp) loop 
    for inner_table in (select *
                          from dept                        
                         where DEPTNO = outer_table.DEPTNO) loop
      dbms_output.put_line(inner_table.*, outer_table.*);
    end loop;
  end loop;
end;
 
 
 
 
 
 
 

 

 

---------------------------------------------哈希连接

 a) 这种方法是在Oracle7后来引入的,使用了比较先进的连接理论,一般来说,其效率应该好于其它2种连接,但是这种连接只能用在CBO优化器中,而且需要设置合适的hash_area_size参数,才能取得较好的性能。

b) 在2个较大的row source之间连接时会取得相对较好的效率,在一个row source较小时则能取得更好的效率。

c) 只能用于等值连接中

 

 

 

 

 

 

 

 ---------------------------------------------笛卡儿乘积

当两个row source做连接,但是它们之间没有关联条件时,就会在两个row source中做笛卡儿乘积,这通常由编写代码疏漏造成(即程序员忘了写关联条件)。笛卡尔乘积是一个表的每一行依次与另一个表中的所有行匹配。在特殊情况下我们可以使用笛卡儿乘积,如在星形连接中,除此之外,我们要尽量使用笛卡儿乘积,否则,自己想结果是什么吧!

注意在下面的语句中,在2个表之间没有连接。

  1. SQL> explain plan for  
  2. select emp.deptno,dept,deptno  
  3. from emp,dept  
  4. Query Plan  
  5. SLECT STATEMENT [CHOOSE] Cost=5 
  6. MERGE JOIN CARTESIAN  
  7. TABLE ACCESS FULL DEPT  
  8. SORT JOIN  
  9. TABLE ACCESS FULL EMP 

CARTESIAN关键字指出了在2个表之间做笛卡尔乘积。假如表emp有n行,dept表有m行,笛卡尔乘积的结果就是得到n * m行结果。

 

 

 

 

 

 

 

 

 

 

 

  • 大小: 31.5 KB
  • 大小: 76.6 KB
  • 大小: 14.3 KB
  • 大小: 17.1 KB
  • 大小: 61.7 KB
  • 大小: 79.7 KB
  • 大小: 55.4 KB
  • 大小: 78.9 KB
  • 大小: 70.4 KB
  • 大小: 63.3 KB
  • 大小: 70.8 KB
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics