`
hz_chenwenbiao
  • 浏览: 997717 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

数据查询优化的方法(转)

阅读更多

1.       用IN来替换OR
下面的查询可以被更有效率的语句替换:
低效:
SELECT field1, field1 FROM LOCATION
WHERE LOC_ID = 10 OR     LOC_ID = 20 OR     LOC_ID = 30

高效
SELECT field1, field1 FROM LOCATION
WHERE LOC_IN IN (10,20,30)    
2.       连接多个扫描
如果你对一个列和一组有限的值进行比较, 优化器可能执行多次扫描并对结果进行合并连接.
举例:
    SELECT * FROM LODGING
    WHERE MANAGER IN (‘BILL GATES’,’KEN MULLER’);
 
    优化器可能将它转换成以下形式
    SELECT *  FROM LODGING
    WHERE MANAGER = ‘BILL GATES’
    OR MANAGER = ’KEN MULLER’;
3.       优化GROUP BY
提高GROUP BY 语句的效率, 可以通过将不需要的记录在GROUP BY 之前过滤掉.下面两个查询返回相同结果但第二个明显就快了许多.
低效:
   SELECT JOB , AVG(SAL) FROM EMP
   GROUP JOB HAVING JOB = ‘PRESIDENT’OR JOB = ‘MANAGER’
 高效:
   SELECT JOB , AVG(SAL) FROM EMP
   WHERE JOB = ‘PRESIDENT’OR JOB = ‘MANAGER’
   GROUP JOB  
4.       用>=替代>
如果DEPTNO上有一个索引, 
高效:
   SELECT *
   FROM EMP
   WHERE DEPTNO >=4
   
   低效:
   SELECT *
   FROM EMP
   WHERE DEPTNO >3

5.       用表连接替换EXISTS
     通常来说 , 采用表连接的方式比EXISTS更有效率
      SELECT ENAME
      FROM EMP E
      WHERE EXISTS (SELECT ‘X’ 
                      FROM DEPT
                      WHERE DEPT_NO = E.DEPT_NO
                      AND DEPT_CAT = ‘A’);

     (更高效)
      SELECT ENAME
      FROM DEPT D,EMP E
      WHERE E.DEPT_NO = D.DEPT_NO
      AND DEPT_CAT = ‘A’ ; 
6.       用EXISTS替换DISTINCT
当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT. 一般可以考虑用EXIST替换 
低效:
    SELECT DISTINCT DEPT_NO,DEPT_NAME
    FROM DEPT D,EMP E
    WHERE D.DEPT_NO = E.DEPT_NO
高效:
    SELECT DEPT_NO,DEPT_NAME
    FROM DEPT D
    WHERE EXISTS ( SELECT ‘X’
                    FROM EMP E
                    WHERE E.DEPT_NO = D.DEPT_NO);

  EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果.
7.       使用表的别名(Alias)
当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误.
(译者注: Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属)

8.       用EXISTS替代IN
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率.
低效:
SELECT * 
FROM EMP (基础表)
WHERE EMPNO > 0
AND DEPTNO IN (SELECT DEPTNO 
FROM DEPT 
WHERE LOC = ‘MELB’)
高效: 
SELECT * 
FROM EMP (基础表)
WHERE EMPNO > 0
AND EXISTS (SELECT ‘X’ 
FROM DEPT 
WHERE DEPT.DEPTNO = EMP.DEPTNO
AND LOC = ‘MELB’)
 (译者按: 相对来说,用NOT EXISTS替换NOT IN 将更显著地提高效率,下一节中将指出)
9.       用NOT EXISTS替代NOT IN
在子查询中,NOT IN子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN都是最低效的 (因为它对子查询中的表执行了一个全表遍历).  为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.
例如:
SELECT …
FROM EMP
WHERE DEPT_NO NOT IN (SELECT DEPT_NO 
                         FROM DEPT 
                         WHERE DEPT_CAT=’A’);
为了提高效率.改写为:
(方法一: 高效)
SELECT ….
FROM EMP A,DEPT B
WHERE A.DEPT_NO = B.DEPT(+)
AND B.DEPT_NO IS NULL
AND B.DEPT_CAT(+) = ‘A’
(方法二: 最高效)
SELECT ….
FROM EMP E
WHERE NOT EXISTS (SELECT ‘X’ 
                    FROM DEPT D
                    WHERE D.DEPT_NO = E.DEPT_NO
                    AND DEPT_CAT = ‘A’);
10.       减少对表的查询
在含有子查询的SQL语句中,要特别注意减少对表的查询.
例如: 
     低效
          SELECT TAB_NAME
          FROM TABLES
          WHERE TAB_NAME = ( SELECT TAB_NAME 
                                FROM TAB_COLUMNS
                                WHERE VERSION = 604)
          AND DB_VER= ( SELECT DB_VER 
                           FROM TAB_COLUMNS
                           WHERE VERSION = 604)
     高效
          SELECT TAB_NAME
          FROM TABLES
          WHERE  (TAB_NAME,DB_VER)
 = ( SELECT TAB_NAME,DB_VER) 
                   FROM TAB_COLUMNS
                   WHERE VERSION = 604)
     Update 多个Column 例子:
     低效:
           UPDATE EMP
           SET EMP_CAT = (SELECT MAX(CATEGORY) FROM EMP_CATEGORIES),
              SAL_RANGE = (SELECT MAX(SAL_RANGE) FROM EMP_CATEGORIES)
           WHERE EMP_DEPT = 0020;
     高效:
           UPDATE EMP
           SET (EMP_CAT, SAL_RANGE) 
= (SELECT MAX(CATEGORY) , MAX(SAL_RANGE)
 FROM EMP_CATEGORIES)
           WHERE EMP_DEPT = 0020;
11. 在Oracle快速进行数据行存在性检查
只检索一个启示就可以判断主键是否能与外键相配,这比Count(*)方法快得多,例如: 
SQL Using Count(*) 
    SELECT Count(*) INTO :ll_Count
       FROM ORDER
       WHERE PROD_ID = :ls_CheckProd
       USING SQLCA;
    
    IF ll_Count > 0 THEN // Cannot delete product 
SQL Using ROWNUM
   SELECT ORDER_ID INTO :ll_OrderID
       FROM ORDER
       WHERE PROD_ID = :ls_CheckProd
          AND ROWNUM < 2
       USING SQLCA;

    IF SQLCA.SQLNRows <> 0 THEN // cannot delete product
12 使用%TYPE、%ROWTYPE方式声明变量
  程序设计中常常要通过变量来实现程序间的数据传递,即将表中数据赋值给变量,或是把变量值插入到表中。而要完成这些操作的前提就是,表中数据与变量类型要一致。然而在实际中,表中数据或类型、或宽度有时要变化,一旦变化,就必须去修改程序中的变量声明部分,否则程序将不能正常运行。为了减少这部分程序的修改,编程时使用%TYPE、%ROWTYPE方式声明变量,使变量声明的类型与表中的保持同步,随表的变化而变化,这样的程序在一定程度上具有更强的通用性。
13.       使用DECODE函数来减少处理时间
使用DECODE函数可以避免重复扫描相同记录或重复连接相同的表.
例如:
   SELECT COUNT(*),SUM(SAL)
   FROM EMP
   WHERE DEPT_NO = 0020
   AND ENAME LIKE ‘SMITH%’;

   SELECT COUNT(*),SUM(SAL)
   FROM EMP
   WHERE DEPT_NO = 0030
   AND ENAME LIKE ‘SMITH%’;

你可以用DECODE函数高效地得到相同结果

SELECT COUNT(DECODE(DEPT_NO,0020,’X’,NULL)) D0020_COUNT,
        COUNT(DECODE(DEPT_NO,0030,’X’,NULL)) D0030_COUNT,
        SUM(DECODE(DEPT_NO,0020,SAL,NULL)) D0020_SAL,
        SUM(DECODE(DEPT_NO,0030,SAL,NULL)) D0030_SAL
FROM EMP WHERE ENAME LIKE ‘SMITH%’;

类似的,DECODE函数也可以运用于GROUP BY 和ORDER BY子句中.
14.       尽量多使用COMMIT
只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少:
 COMMIT所释放的资源:
a.       回滚段上用于恢复数据的信息.
b.       被程序语句获得的锁
c.       redo log buffer 中的空间
d.       ORACLE为管理上述3种资源中的内部花费
15.       整合简单,无关联的数据库访问
如果你有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系)
例如:

SELECT NAME 
FROM EMP 
WHERE EMP_NO = 1234;

SELECT NAME 
FROM DPT
WHERE DPT_NO = 10 ;

SELECT NAME 
FROM CAT
WHERE CAT_TYPE = ‘RD’;

上面的3个查询可以被合并成一个:

SELECT E.NAME , D.NAME , C.NAME
FROM CAT C , DPT D , EMP E,DUAL X
WHERE NVL(‘X’,X.DUMMY) = NVL(‘X’,E.ROWID(+))
AND NVL(‘X’,X.DUMMY) = NVL(‘X’,D.ROWID(+))
AND NVL(‘X’,X.DUMMY) = NVL(‘X’,C.ROWID(+))
AND E.EMP_NO(+) = 1234
AND D.DEPT_NO(+) = 10
AND C.CAT_TYPE(+) = ‘RD’; 
16.       WHERE子句中的连接顺序.
ORACLE采用自下而上的顺序解析WHERE子句,根据这个原理,表之间的连接必须写在其他WHERE条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾.
例如:
(低效,执行时间156.3秒)
SELECT … 
FROM EMP E
WHERE  SAL > 50000
AND    JOB = ‘MANAGER’
AND    25 < (SELECT COUNT(*) FROM EMP
             WHERE MGR=E.EMPNO);

(高效,执行时间10.6秒)
SELECT … 
FROM EMP E
WHERE 25 < (SELECT COUNT(*) FROM EMP
             WHERE MGR=E.EMPNO)
AND    SAL > 50000
AND    JOB = ‘MANAGER’;
17.     减少访问数据库的次数
当执行每条SQL语句时, ORACLE在内部执行了许多工作: 解析SQL语句, 估算索引的利用率, 绑定变量 , 读数据块等等. 由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量.

例如,
    以下有三种方法可以检索出雇员号等于0342或0291的职员.

方法1 (最低效)
    SELECT EMP_NAME , SALARY , GRADE
    FROM EMP 
    WHERE EMP_NO = 342;
     
    SELECT EMP_NAME , SALARY , GRADE
    FROM EMP 
    WHERE EMP_NO = 291;

方法2 (次低效)
    
    DECLARE 
        CURSOR C1 (E_NO NUMBER) IS 
        SELECT EMP_NAME,SALARY,GRADE
        FROM EMP 
        WHERE EMP_NO = E_NO;
    BEGIN 
        OPEN C1(342);
        FETCH C1 INTO …,..,.. ;
        …..
        OPEN C1(291);
       FETCH C1 INTO …,..,.. ;
         CLOSE C1;
      END;

方法3 (高效)

    SELECT A.EMP_NAME , A.SALARY , A.GRADE,
            B.EMP_NAME , B.SALARY , B.GRADE
    FROM EMP A,EMP B
    WHERE A.EMP_NO = 342
    AND   B.EMP_NO = 291; 

分享到:
评论

相关推荐

    SQLServer2008查询性能优化 2/2

    7.1 统计在查询优化中的角色 161 7.2 索引列上的统计 162 7.2.1 更新统计的好处 162 7.2.2 过时统计的缺点 164 7.3 在非索引列上的统计 165 7.3.1 在非索引列上统计的好处 166 7.3.2 丢失非索引列上的统计的...

    大数据实战Demo系统-MaxCompute数据仓库数据转换实践.zip

    读者将学习到如何配置和使用MaxCompute的数据转换功能,优化SQL查询,使用UDF(用户自定义函数)来扩展数据处理能力,以及如何监控和管理作业执行的性能。通过本文档,用户可以掌握在MaxCompute平台上进行数据转换的...

    Microsoft SQL Server中的星形连接查询优化

    该文讨论微软SQLServer在决策支持查询上采取的查询优化和执行策略,方法是基于模式匹配的,检测典型的星型查询模式,当与模式匹配后,优化器生成附加的查询计划方案,显著提高数据仓库的性能。对于高选择性查询,计划使用...

    Microsoft SQL Server 2008技术内幕:T-SQL查询(第二卷)

    主要内容包括SQL的基础理论、查询优化、查询算法及复杂度,以及在使用子查询、表表达式、排名函数、数据聚合和透视转换、TOP和APPLY、数据修改、分区表、特殊数据结构等实际应用时会遇到的各种高级查询问题和解决...

    Microsoft_SQL_Server_2005技术内幕:T-SQL查询.pdf

     优化方法论  分析实例级的等待  联系等待和队列  确定方案  细化到数据库/文件级别  细化到进程级别  优化索引/查询  查询优化工具  syscacheobjects  清空缓存  动态管理对象  STATISTICS IO  测量...

    SQLServer的性能调优:解决查询速度慢的五种方法

    有几个DMV提供有关查询统计信息,执行计划,最近查询等的数据。这些可以一起使用,以提供一些惊人的见解。例如,下面的查询可用于查找使用最多读取,写入,工作时间(CPU)等的查询。查询结果如下所示。下面的图片...

    分布式数据库试题及答案.doc

    4.1.2. 半连接方法和枚举法各适用于何种查询优化情况. 25 4.1.3. 分布式事务有哪些基本性质. 25 4.1.4. 什么是2PL协议 25 4.2. 下面是某个公司的人事关系数据库的全局模式: 25 4.2.1. 将全局模式进行分片,写出分片...

    SQLServer2008查询性能优化 1/2

    7.1 统计在查询优化中的角色 161 7.2 索引列上的统计 162 7.2.1 更新统计的好处 162 7.2.2 过时统计的缺点 164 7.3 在非索引列上的统计 165 7.3.1 在非索引列上统计的好处 166 7.3.2 丢失非索引列上的统计的...

    一种大数据智能分析平台的数据分析方法及实现技术.doc

    一种大数据智能分析平台的数据分析方法及实现技术 作者:蓝科 李婧 来源:《数字技术与应用》2017年第03期 摘要:文章介绍了一种用于大数据智能分析平台的数据分析方法及实现技术, 介绍了这种方法的需求和意义;...

    大数据分析方法.pdf

    因此,数据挖掘是一门交叉 学科,它把人们对数据的应用从低层次的简单查询,提升到从数据中挖掘知识,提供决策支 持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、数 理统计、可视...

    游戏数据分析.pdf

    游戏数据分析 变量选择 通过⽹络数据获取,得到游戏数据指标如下所⽰: 游戏数据分析的整体思路 第⼀步;数据⽂件获取(1.导⼊数据 2.查询结构 3.更改结构 4.汇总变量信息); 第⼆步;数据预处理(1.剔除缺失值2....

    oracle的sql优化

    oracle的sql优化方法 1.全表扫描和索引扫描  大数据量表尽量要避免全表扫描,全部扫描会按顺序每条记录扫描,对于&gt;100万数据表影响很大。  Oracle中通过RowID访问数据是最快的方式  对字段进行函数转换,或者前...

    宿舍管理系统

    4.2模型优化 9 4.3数据处理 9 5.物理结构设计 10 5.1数据存储 10 5.2系统功能模块 11 5.2.1 楼道工人基本的信息查询和更新 11 5.2.2 宿舍楼基本信息的查询和更新 11 5.2.3宿舍基本信息的查询和更新 12 5.2.4学生...

    将SQL数据表转成Access表

    2此程序可以优化考虑多线程,一线程读SQL数据,一条做新增到Access数据库操作!! 3有经过试验,导入100万条数据,要时间大概10分钟左右,如果要导出大数据的朋友,做好设置好,可以去洗澡后再出来!! 4在...

    图数据库查询与算法正确性验证讲解ppt

    二、关系型数据转换成图数据的方法 - 不同的图数据建模方式 三、图计算与图数据库的区别 - 静态数据与动态数据 - OLAP与OLTP - 单边图与多边图 - 属性过滤 - 数据持久化 - 应用场景 - 数据一致性 - 图算法丰富度 - ...

    Oracle Sql 性能优化

    ORACLE在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间 4、CASE 表达式WHEN…… CASE 表达式 WHEN THEN…比 CASE WHEN 表达式 THEN… 效率要高(没有...

    SQL 优化原则

    (转)SQL 优化原则 一、问题的提出  在应用系统开发初期,由于开发数据库数据比较少,对于查询SQL语句,复杂视图的的编写等体会不出SQL语句各种写法的性能优劣,但是如果将应用系统提交实际应用后,随着数据库中...

    数据挖掘与分析.doc

    在数据仓库的数据存储和管理中需要解决的是如何管理大量的数据、 如何并行处理大量的数据、如何优化查询等。 3.数据的展现 主要的方式有:查询:实现预定义查询、动态查询、OLAP查询与决策支持智能 查询;报表:...

    SQl优化34条[参考].pdf

    ORACLE 在解析的过程中,会将 '*' 依次转换成所有的列名,这个工作是通过查询数据字典完成的。这意味着将耗费更多的时间。 (4)减少访问数据库的次数 ORACLE 在内部执行了许多工作:解析 SQL 语句,估算索引的...

Global site tag (gtag.js) - Google Analytics