`
nlslzf
  • 浏览: 1026233 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

如何在亿级记录表中创建索引

阅读更多
http://ninedns.com/oracle/200742218395312863.html

1. 查看表的具体情况

查看是不是分区表,有多少个分区、分区字段:

SQL> col table_name for a20

SQL> col column_name for a20

SQL> select a.table_name,a.partitioned,b.partition_count,c.column_name

2 from user_tables a, user_part_tables b, user_part_key_columns c

3 where a.table_name='STAT_SUBMIT_CENTER'

4 and b.table_name='STAT_SUBMIT_CENTER'

5 and c.name='STAT_SUBMIT_CENTER';

TABLE_NAME PAR PARTITION_COUNT COLUMN_NAME

-------------------- --- --------------- --------------------

STAT_SUBMIT_CENTER YES 50 MSGDATE

查看已使用的每个分区的大小:

SQL> select segment_name,partition_name,round(bytes/1024/1024) from user_segments

where segment_name ='STAT_SUBMIT_CENTER' and bytes/1024/1024>0.25 order by 3 desc;

SEGMENT_NAME PARTITION_NAME

SEGMENT_NAME PARTITION_NAME ROUND(BYTES/1024/1024)

-------------------------- ------------------------------ ----------------------

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051101 1722

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051021 1488

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051111 1440

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051121 1355

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051221 1335

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20050911 1309

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051211 1253

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051201 1247

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20050921 1198

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20060101 1151

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20060111 1068

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051001 1018

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20051011 865

STAT_SUBMIT_CENTER STAT_SUBMIT_CENTER_20060121 796

14 rows selected.

查看整个表的大小:

SQL> select segment_name,sum(bytes/1024/1024) from user_segments

where segment_name ='STAT_SUBMIT_CENTER' group by segment_name;

SEGMENT_NAME

SEGMENT_NAME SUM(BYTES/1024/1024)

-------------------------------- --------------------

STAT_SUBMIT_CENTER 17234

查看表的记录数:

SQL> set timing on

SQL> select count(*) from STAT_SUBMIT_CENTER;

COUNT(*)

----------

170341007

Elapsed: 00:14:18.60

查看这个表上的索引情况如下:

table STAT_SUBMIT_CENTER 17234 M

index IDX_SUBCEN_ADDRUSER 5155 M ADDRUSER

PK_STAT_SUBMIT_CENTER 10653 M MSGDATE,ADDRUSER,MSGID

然后,查看一些数据库参数情况:

SQL> show parameter work

NAME TYPE VALUE

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

workarea_size_policy string AUTO

SQL> show parameter pga

NAME TYPE VALUE

------------------------------------ ----------- ------------------------------

pga_aggregate_target big integer 209715200

SQL> select * from dba_temp_files;

FILE_NAME

------------------------------------------------------------------------------------------------------------------------

FILE_ID TABLESPACE_NAME BYTES BLOCKS STATUS RELATIVE_FNO AUT MAXBYTES MAXBLOCKS

---------- ------------------------------ ---------- ---------- --------- ------------ --- ---------- ----------

INCREMENT_BY USER_BYTES USER_BLOCKS

------------ ---------- -----------

/bgdata/oracle/temp01.dbf

1 TEMP 3563061248 434944 AVAILABLE 1 YES 4294967296 5242886400 3562012672 434816

2. 需要考虑的几个方面

1)创建的索引需要几个G的磁盘空间。

2)创建索引需要排序,使用pga_aggregate_target,要把这个值从200M加大到2G。

3)如果内存不够,需要temp表空间,则要把temp表空间加大到8G——itpub上有一个帖子说过,15亿条记录用了34G空间。

4)在线创建,时间会比较长。讨论后,停止这个表的操作,非online创建。

3. 实际操作过程

1)数据文件够,不扩展;temp数据文件扩展:

alter database tempfile '/bgdata/oracle/temp01.dbf' resize 8192m;

2)在workarea_size_policy=AUTO的情况下,改pga_aggregate_target=2048m。对于串行操作,一个session能使用的pga=MIN(5%PGA_AGGREGATE_TARGET,100MB),这样可以使得pga用到最大的值:

alter system set pga_aggregate_target=2048m;

3)因为这是一个比较长的过程,所以写脚本让后台运行:

nohup time createind.sh &

vi createind.sh

#!/bin/sh

sqlplus user/password <

create index IDX_SUBMIT_RECORDTIME on STAT_SUBMIT_CENTER(RECORDTIME) local;

exit

EOF

4)创建过程中可以观察v$sort_segment,v$sort_usage看排序情况:

nohup time createind.sh &

vi createind.sh

#!/bin/sh

sqlplus user/password <

create index IDX_SUBMIT_RECORDTIME on STAT_SUBMIT_CENTER(RECORDTIME) local;

exit

EOF

5)创建完成后,把tempfile和pga_aggregate_target改回原值:

alter database tempfile '/bgdata/oracle/temp01.dbf' resize 4096m;

alter system set pga_aggregate_target=500m;

4. 实际创建过程中观察到的情况

1)开始之前:

SQL> select tablespace_name,current_users,total_blocks,used_blocks,free_blocks from v$sort_segment;

TABLESPACE_NAME CURRENT_USERS TOTAL_BLOCKS USED_BLOCKS FREE_BLOCKS

------------------------------- ------------- ------------ ----------- -----------

TEMP 0 431360 0 431360

SQL> select * from v$sort_usage;

no rows selected

2)创建之初,抓到这么一条sql:

insert into obj$(owner#,name,namespace,obj#,type#,ctime,mtime,st

ime,status,remoteowner,linkname,subname,dataobj#,flags,oid$,spar

e1,spare2)values(:1,:2,:3,:4,:5,:6,:7,:8,:9,:10,:11,:12,:13,:14,

:15,:16, :17)

3)然后v$sort_segment.USED_BLOCKS变大,v$sort_usage.BLOCKS变大,一直增长到:

SQL> select tablespace_name,current_users,total_blocks,used_blocks,free_blocks from v$sort_segment;

TABLESPACE_NAME CURRENT_USERS TOTAL_BLOCKS USED_BLOCKS FREE_BLOCKS

------------------------------- ------------- ------------ ----------- -----------

TEMP 1 431360 46720 384640

SQL> select * from v$sort_usage;

USERNAME USER SESSION_ADDR SESSION_NUM SQLADDR SQLHASH

------------------------------ ------------------------------ ---------------- ----------- ---------------- ----------

TABLESPACE CONTENTS SEGTYPE SEGFILE# SEGBLK# EXTENTS BLOCKS SEGRFNO#

------------------------------- --------- --------- ---------- ---------- ---------- ---------- ----------

DPC DPC 00000003974CFFB0 6134 0000000399CAB288 1254950678

TEMP TEMPORARY SORT 201 431113 365 46720 1

这个过程中抓到的sql为:

select file# from file$ where ts#=:1

4)v$sort_segment.USED_BLOCKS变为0,v$sort_usage.BLOCKS变为0。

5)重复3,4两步,估计这个是创建一个分区的索引。

需要解释一下的是,上面的sql只是我随机抓到的运行时间比较长的,整个create index过程会复杂很多,具体怎么样可以用sqltrace跟踪。这里主要看的是temp表空间的使用情况。

同时,在创建的过程中:

SQL> select segment_name,partition_name from user_segments where segment_name='IDX_SUBMIT_RECORDTIME';

no rows selected

SQL> select index_name,partition_name from user_ind_partitions where INDEX_NAME='IDX_SUBMIT_RECORDTIME';

no rows selected

当时忘了查user_segments中其实是有一个segment_name为一串数字的记录,那个才是正在创建的索引;如果这个事务失败了,将回滚。

最后耗时99分钟完成。

5. 创建完成后分析索引

但是接下来还有一件事。创建完成后要分析索引,否则就是走了索引,查询速度也会很慢。

SQL> explain plan for select count(*) from stat_submit_center where recordtime>trunc(sysdate);

Explained.

SQL> @?/rdbms/admin/utlxplp.sql

PLAN_TABLE_OUTPUT

------------------------------------------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes | Cost | Pstart| Pstop |

-------------------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 1 | 9 | 4 | | |

| 1 | SORT AGGREGATE | | 1 | 9 | | | |

| 2 | PARTITION RANGE ALL | | | | | 1 | 50 |

|* 3 | INDEX FAST FULL SCAN| IDX_SUBMIT_RECORDTIME | 8878K| 76M| 4 | 1 | 50 |

-------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

3 - filter("STAT_SUBMIT_CENTER"."RECORDTIME">TRUNC(SYSDATE@!))

Note: cpu costing is off

16 rows selected.

SQL> set autotrace on explain

SQL> set timing on

SQL> select count(*) from stat_submit_center where recordtime>trunc(sysdate);

aa^Cselect count(*) from stat_submit_center where recordtime>trunc(sysdate)

*

ERROR at line 1:

ORA-01013: user requested cancel of current operation

Elapsed: 00:11:49.85

SQL>

SQL> set autotrace off

上面可以看到,因为没有分析索引,虽然它走的是新建的IDX_SUBMIT_RECORDTIME索引,但是查询速度很慢,10分钟后也没有结果。下面我们分析一下:

SQL> Analyze index IDX_SUBMIT_RECORDTIME estimate statistics;

Index analyzed.

Elapsed: 00:00:06.84

SQL> set autotrace on explain

SQL> select count(*) from stat_submit_center where recordtime>trunc(sysdate);

COUNT(*)

----------

926736

Elapsed: 00:00:05.37

Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=CHOOSE (Cost=4360 Card=1 Bytes=9)

1 0 SORT (AGGREGATE)

2 1 PARTITION RANGE (ALL)

3 2 INDEX (RANGE SCAN) OF 'IDX_SUBMIT_RECORDTIME' (NON-UNI

QUE) (Cost=4360 Card=8878740 Bytes=79908660)

SQL> set autotrace off

索引分析之后,查询时间为5分钟左右,效率大大提高。

至此,完成全部操作。

作者简介:柔嘉维则;作者Email地址为baobaoc@hotmail.com;作者Blog为http://spaces.msn.com/roujiaweize/
分享到:
评论

相关推荐

    [Oracle]如何在亿级记录表中创建索引

    [Oracle]在亿级记录表中创建索引 [Oracle]如何在亿级记录表中创建索引 [Oracle]如何在亿级记录表中创建索引

    SQL 如何建立索引来加快数据库的查询

    在已经存在的表上创建索引5.2.2.1. alter语句创建索引5.2.2.2. create语句创建索引6. 查看索引6.1. explain关键字查看索引6.2. show index关键字查看索引7. 删除索引7.1. alter关键字删除索引7.2. drop关键字删除...

    MySQL高级.zip

    频繁更新的字段不适合创建索引 -- 因为每次更新不单单是更新了记录还会更新索引 Where条件里用不到的字段不创建索引 单键/组合索引的选择问题,who?(在高并发下倾向创建组合索引) 查询中排序的字段,排序字段若...

    实验四 存储过程、触发器与索引

    (4)使用“实验一”中的数据库“abc”,练习使用触发器,在销售表上创建触发器tr_updateprice,每次新增销售记录时,自动更新产品表的单价,更新方法是:每增加一笔销售记录,就将该产品的单价减去1块钱。...

    MySQL数据库:索引概述.pptx

    在编写SQL查询语句时,具有索引的表与不具有索引的表没有任何区别,索引只是提供一种快速访问指定记录的方法。 索引概述 索引的作用 索引是一种提高查找速度的机制 索引用来快速地寻找那些具有特定值的记录,如果...

    SQLSERVER 创建索引实现代码

    同理,SQL Server允许用户在表中创建索引,指定按某列预先排序,从而大大提高查询速度。 • SQL Server中的数据也是按页(4KB)存放 • 索引:是SQL Server编排数据的内部方法。它为SQL Server提供一种方法来编排...

    MSSQL 大量数据时,建立索引或添加字段后保存更改提示超时的解决方法

    一时不知所措,蜡人张的文章 代码如下: 修改表属性后使用“索引/键”对话框为一个大型表(记录数13,239,473)创建索引,提示: – 无法创建索引“IX_TableName”。 超时时间已到。在操作完成之前超时时间已过或...

    分析源代码自动生成数据表索引方案(QT代码)

    分析大型系统源代码中包含的SQL语句,解析这些SQL语句访问的数据表和条件表达式,连接数据库,探测对应的数据表包含的记录个数和参与条件过滤的字段的有效值个数,为数据表构建索引策略提供,并自动生成索引创建脚本...

    简单介绍MySQL中索引的使用方法

    数据库索引是一个数据结构,提高操作的速度,在一个表中可以使用一个或多个列,提供两个快速随机查找和高效的顺序访问记录的基础创建索引。 在创建索引时,它应该被认为是将SQL查询的那些列上创建一个或多个索引的列...

    MYSQL 高级篇之数据库搜索引擎及原理

    在创建索引时, 可以指定在删除、更新父表时,对子表进行的相应操作,包括 RESTRICT、CASCADE、SET NULL 和 NO ACTION。 RESTRICT和NO ACTION相同, 是指限制在子表有关联记录的情况下, 父表不能更新; CASCADE...

    ORACLE重建索引总结

    3 、rebuild online 时系统会产生一个 SYS_JOURNAL_xxx 的 IOT 类型的系统临时日志表 , 所有 rebuild online 时索引的变化都记录在这个表中 , 当新的索引创建完成后 , 把这个表的记录维护到新的索引中去 , 然后 ...

    数据库的索引

    索引即存储在磁盘空间中的数据库结构,包含数据表中所有创建索引的记录。 所有的存储引擎

    MySql索引详解,索引可以大大提高MySql的检索速度

    创建索引时,你需要确保该索引是应用在SQL查询语的条件(一般作为WHERE 子句的条件)实际上,索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录。上面都在说使用索引的好处,但过多的使用索引将会造成...

    MySQL中建立索引的集中方式

     在数据库表中,对字段建立索引可以大大提高查询速度。假如我们创建了一个 mytable表:  CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL ); 我们随机向里面插入了10000条记录,...

    数据库完整性实验-完整代码.rar

    (7)创建一个触发器student_update,实现功能:如果在学生表中修改了学号,则自动修改成绩表中的学号。 (8)创建一个级联删除触发器student_delete。要求:当从学生表中删除某学生信息时,同时删除score表中此学生...

    MySQL 主键与索引的联系与区别分析

    所谓主键就是能够唯一标识表中某一行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引。因为主键可以唯一标识某一行记录,所以可以确保执行数据更新、删除的时候不会出现张冠李戴的错误。主键除了上述...

    MySQL中表索引定义的方法与介绍

    索引是 DBMS 根据表中的一列或若干列按一定的顺序建立的列值与记录行之间的对应关系表,方便 DBA 管理 索引是以文件的形式存储,DBMS 将一张表的所有所有保存在同一个索引文件中,需要占用磁盘空间,如果有大量索引...

    Access数据库应用教程(2)

    表的设计主要包括输入字段名、选择数据类型、设置字段属性、创建主键、创建索引和建立表之间关系等内容。表的基本操作包括如何在数据库窗口和数据表视图中操作。在数据库窗口中可以修改表名称、删除表和复制表。在...

    MySQL 的覆盖索引与回表的使用方法

    两大类索引 使用的存储引擎:MySQL5.7 InnoDB 聚簇索引 * 如果表设置了主键,则主键就是聚...普通索引也叫二级索引,除聚簇索引外的索引,即非聚簇索引。 InnoDB的普通索引叶子节点存储的是主键(聚簇索引)的值,而My

    MySQL全文索引应用简明教程

    本文从以下几个方面介绍下MySQL全文索引的基础知识: MySQL全文索引的几个注意事项 全文索引的语法 几种搜索类型的简介 ... 对于一个大数量级记录插入,向没有索引的表中插入数据后创建索引比向有

Global site tag (gtag.js) - Google Analytics