`
newleague
  • 浏览: 1471821 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类

如何看Oracle执行计划

阅读更多

oracle执行计划解释
         一.相关概念
                1·rowid,伪列:就是系统自己给加上的,每个表都有一个伪列,并不是物理存在。它不能被修改,删除,和添加,rowid在该行的生命周期是唯一的,如果向数据库插入一列,只会引起行的变化,但是rowid并不会变。
                2·recursive sql概念:当用户执行一些SQL语句时,会自动执行一些额外的语句,我们把这些额外的SQL语句称为“recursive calls” 或者是“recursive sql statement”,当在执行一个DDL语句时,Oracle总会隐含的发出一些Recursiv sql语句,用于修改数据字典,如果数据字典没有在共享内存中,则就执行“resursive calls”,它会把数据字典从物理读取到共享内存。当然DML和select语句都可能引起recursive SQL。
                3·row source 行源:在查询中,由上一操作返回的符合条件的数据集,它可能是整个表,也可能是部分,当然也可以对2个表进行连接操作(join)最后得到的数据集
                4·predicate:一个查询中的where限制条件
                5·driving table 驱动表:该表又成为外层表,这个感念用于内嵌和HASH连接中,如果返回数据较大,会有负面影响, 返回行数据较小的适合做驱动表
                6·probed table 被探查表:该表又称为内层表,我们在外层表中取得一条数据,在该表中寻找符合连接的条件的行。
                7·组合索引(concatenated index)由多个列组成的索引,在组合索引中有一个重要的概念,就是引导索引,
                        create index idx_tab on tab(col1,col2,col3),              
                        indx_tab则称为组合索引,
                        col1则称为引导列
                  在查询条件where后,必须使用引导索引,才会使用该组合索引
                8.可选择性(selectivity)比较一下列中唯一键的数量和表中的行数,就可以判断该列的可选择性。 如果该列的“唯一键的数量/表中的行数”的比值越接近1,则该列的可选择性越高,该列就越适合创建索引,同样索引的可选择性也越高。在可选择性高的列上进 行查询时,返回的数据就较少,比较适合使用索引查询。
        二.Oracle访问数据的存取方法
                1.全表扫描(Full tabel scans,FTS)
为了实现全表扫描,Oracle读取数据库中的每一行,并检查每一行是否满足语句的where限制条件一个多块读操作,可以使io能读取多块数据块。减少了IO次数,提高了系统的吞吐量。在多块读的方法的使用下,可以高效的实现数据库全表扫描,而且,中有在全表扫描的情况下,在可以使用多块读的方法。在这个种访问模式下,数据块只读一次。
        【注意】
         使用FTS的前提是,在较大的表中,不建议使用FTS,除非取出的数据较多,超过总量的5%-10%,或者使用并行查询时
                2.通过rowid的表存取
                        行的ROWID指向了该行的数据文件,数据块,以及在数据块中的位置,使用rowid能快速的定位到要取得数据的行上,在Oracle中,这是取得单行最快的方式。
         【注意】
                该存取方法,不会用到多块读操作,一次IO只能读取一个数据块。
                3.索引扫描(index scan 和 index lookup)
                        索引扫描时通过index查找到对应行的rowid,然后通过rowid从数据库中得到具体的数据。该方法分为两个步骤,
                        (1)扫描索引得到得到rowid
                                说明:索引中不止储存着索引值,还存放的行的rowid
                        (2)通过rowid得到表中的数据
                        【注意】
                         1.由于索引经常使用,因此绝大多数都Cache到内存当中,所以第一步通常是逻辑IO,即数据可以从内存中取得
                        2.但是对第二步来说,如果数据比较大,就不可能存放在内存,因此是个物理操作,是极其耗时间的,因此,从大表中
                        进行索引扫描,如果数量大于总数的5%-10%,则效力会下降很多
                        3.如果索引的数据都能在内存中能找到,就可以避免第二步操作,避免了不必要的IO。效力会很高。
                        4.如果SQL语句会对索引排序,因为索引已经预先排好了序,索引在执行计划中不需要在对索引排序。根据索引的类型与where限制条件的不同,有4种数据类型的索引
                        1.唯一索引(index unique scan)
                        通过唯一索引查找一个数值,通常是rowid,如果表中存在unique,或者是primary key的话,Oracle通常实现唯一索引;
                        2.索引范围扫描(index range scan)
                                如果要取得多行数据,通常在唯一索引上加上范围操作,例如(>,<)
                                *使用index rang scan的三种情况
                                (a)在唯一索引上有where条件筛选
                                (b)在组合索引上,使用部分列进行查询,导致查询出多行
                                (c)对非唯一 索引列进行的任何查询
                      3.索引全扫描(index full scan)
                      与全表扫描想对应的就是全索引扫描,它必要保证要取得的数据都从索引中直接得到
                                例:
                   Index BE_IX is a concatenated index on big_emp (empno, ename)
                   SQL> explain plan for select empno, ename from big_emp order by empno,ename;
                   4.索引快速扫描(index fash full scan)
                   索引快速扫描和index full scan相似,不会对查询出的数据进行排序。      
        三.表之间的连接
                 根据row source连接的条件不同,可以分为等值连接(where a.col3=b.col4)非等值连接(where a.col3>b.col4)外连接 (where a.col3=b.col4(+))
                1.典型的连接类型
                        (a)排序--合并连接(sort merge join,SMJ)
                        (b)嵌套循环(nested loops,NL)
                        (c)哈希连接(hash join,)
                A.排序--合并连接
                        1)首先生成row source1需要的数据,让后对连接关联的列进行排序。
                        2)然后生成row source2需要的数据,然后对这些数据按照与row socurce1相对应的操作关联列进行排序。
                        3)将两边排好序的数据进行合并操作,将2个row source按照连接条件连接起来。
                        [注意]
                        ·.如果row source已经在关联上列上被排序,那个连接操作就不会执行sort操作,将大大的提高效率,因为排序时极其 消耗资源的,预先被排序的row source包括索引,或者已经排好序的列。
                        ·.排序是非常耗时的操作,尤其是大表,基于这个原因,SMJ通常不是一个好的解决办法,如果排序的工作早已做好那将极大的提高效率
                          ·.对于非等值连接,这种连接方式的效率是比较高的。
                B.嵌套循环。
                      在连接有驱动表的概念,实际上连接过程就是2层嵌套循环,外层表越小越好。
                        [执行原理]
                        从内部表来看,需要得到外层表的每一行,去匹配内部表的所有行,因此保持外部表尽可能小,和高效率访问内部表,是连接性能的关键。
                        [优点]
                         nested loops可以返回已经连接的行,而不必等待所有的行连接完,因此能快速响应,特别适合用在需要快速响应的语句中。
                     C.hash join
                        较小的row source用来构建hash table和bitmap,而第二个用来被hansed,并与第一个生成的hash table进行匹配。
                        bitmap用来作为一种较快查询的方法,用来检查hash table是否有匹配的行,特别在表大的情况下,不能容纳在内存中,这个连接方法非常有效。这个链接,也有驱动表的概念,有来构造hash table,bitmap的表叫驱动表,如果被 构建的hash table,bitmap都能容纳在内存中,这个效率非常高。
                        【注意】
                        1) 要使哈希连接有效,需要设置HASH_JOIN_ENABLED=TRUE,缺省情况下该参数为TRUE,另外,不要忘了还要设置 hash_area_size参数,以使哈希连接高效运行,因为哈希连接会在该参数指定大小的内存中运行,过小的参数会使哈希连接的性能比其他连接方式还要低。
                        2)只能用于等值连接。
                        3)在2个较大的row source之间连接时会取得相对较好的效率,在一个row source较小时则能取得更好的效率。
      

         解释结果:
                1.AND-EQUAL 该步骤具有两个或更多个子步骤,每一个子步骤返回一系列的ROWID.AND-EQUAL操作选择的是索引子操作返回的rowid      
                2.BITMAP
                        conversoin to rowids --将位图从位图索引转换成可以用于提取实际资料的一系列的ROWID
                        conversoin from rowids --将一系列的ROWID转换成位图表示
                        conversoin count --对位图的行数进行统计
                        index single scan --为单个索引提取位图
                        index range scan --返回的位图是一定范围的关键值
                        index full scan --扫描整个位图索引
                        MERGE        --合并两个位图,并作为一个位图返回结果
                        Minus --该操作是merge的相反操作,而且可以具有两个或3个子操作并返回位图
                                第一个子操作返回的位图用作起点,第一个位图减去第二个位图中提供所   有行。如果第二个位图为空,那么所有的null列也将被减去。
                        or  --将两个位图作为输入
                3.connect by --分层提取行,因为查询采用了CONNECT BY C从句
                4.concatenaction --合并多个行集为一行。
                5.count --计算从表中选择的行数
                        stopkey --计算的行数被查询语句中的where 中的 rownum所限制
                6.filter --将一系列的行数作为输入,并过滤到where从句查询而得到的结果
                7.first row --提取查询结果集的第一行
                8.for udpate -- 为提取的行加锁。
                9.hash join --使用散列连接法连接两张表
                10.index
                        unique --从索引中查找唯一值
                        range scan --从一定范围中查找,是按照升序的方式
                        range scans desc --扫描行在一定范围之内,但是是按照降序的方式
                11.inlist iterator --在in谓词中为一个值执行一次或者多次操作
                13 intersection --将两个结果集合并成一个集,并返回在它们之间出现的共同的值
                14 merger join --提供共同值,用来连接两个结果集的结果。是内连接
                         output --外
                         anit --反
                         seml --半
                15 nested loops --该操作涉及到2个子操作,第一操作个返回一个行集,被用于行集中的每一行,执行第二个子操作。
                         output --用于执行外部套嵌套循环
                16 partition [分区] --执行一或者多个分区操作,partition-start,partition-stop将提供分区的范围
                                singnal  --显示操作将在单个分区上执行
                                iterator        --在许多个分区中执行
                                all  --显示操作将在所有分区上执行
                                inlist --显示操作在分区上执行,并用IN谓词驱动
                17 projection --采用多个查询作为输入,并返回单个记录集。常和intersection,minus, unqie使用      
                18 sort
                        aggregate --在行集上采用分组函数
                        unique  --对行集排序,去掉重复的行
                        join  -- 和merger相同
                        group up -- 分组排序
                        orday by --按照orday by进行排序
                19 table access
                                full --显示指定表中的所有行
                                cluster --与特定索引键进行匹配的所有行
                                hash  --散列
                                by rowid --显示oracle表将从rowid提取
                20 unqie 显示两个集,并去掉重复行
                21 view 产生视图,并返回结果行集。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics