Oracle表分区和索引分区

charles751

浏览: 708838 次
性别:
来自: 北京

最近访客更多访客>>

xiexjbailx

hhjhbhj163

LD_21

c_senping

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Oracle

Oracle SQL Google

表空间及分区表的概念

表空间:

是一个或多个数据文件的集合，所有的数据对象都存放在指定的表空间中，但主要存放的是表，所以称作表空间。

分区表：
当表中的数据量不断增大，查询数据的速度就会变慢，应用程序的性能就会下降，这时就应该考虑对表进行分区。表进行分区后，逻辑上表仍然是一张完整的表，只是将表中的数据在物理上存放到多个表空间(物理文件上)，这样查询数据时，不至于每次都扫描整张表。

表分区的具体作用

Oracle的表分区功能通过改善可管理性、性能和可用性，从而为各式应用程序带来了极大的好处。通常，分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务，分区是构建千兆字节数据系统或超高可用性系统的关键工具。

分区功能能够将表、索引或索引组织表进一步细分为段，这些数据库对象的段叫做分区。每个分区有自己的名称，还可以选择自己的存储特性。从数据库管理员的角度来看，一个分区后的对象具有多个段，这些段既可进行集体管理，也可单独管理，这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是，从应用程序的角度来看，分区后的表与非分区表完全相同，使用 SQL DML 命令访问分区后的表时，无需任何修改。

分区概述

为了简化数据库大表的管理,例如在数据仓库中一般都是TB级的数量级.ORACLE8以后推出了分区选项.分区将表分离在若于不同的表空间上,用分而治之的方法来支撑无限膨胀的大表,增强大表在物理一级的可管理性.将大表分割成较小的分区可以改善表的维护、备份、恢复、事务及查询性能。

什么时候使用分区表：
1、表的大小超过2GB。

2、表中包含历史数据，新的数据被增加都新的分区中。

分区的优点：

1、增强可用性：如果表的一个分区由于系统故障而不能使用，表的其余好的分区仍可以使用；

2、减少关闭时间：如果系统故障只影响表的一部份分区，那么只有这部份分区需要修复，矿能比整个大表修复花的时间更少；

3、维护轻松：如果需要得建表，独产管理每个公区比管理单个大表要轻松得多；

4、均衡I/O：可以把表的不同分区分配到不同的磁盘来平衡I/O改善性能；

5、改善性能：对大表的查询、增加、修改等操作可以分解到表的不同分区来并行执行，可使运行速度更快，在数据仓库的TP查询特别有用。

6、分区对用户透明，最终用户感觉不到分区的存在。

create tablespace dw1 datafile 'D:\oracle\oradata\ora9\dw11.ora' size 50M create tablespace dw2 datafile 'D:\oracle\oradata\ora9\dw21.ora' size 50M

一、按范围分区：固名思义就是按一定range来分区，看下面的例子:

SQL> set linesize 1000

SQL> create table niegc_part

2 (

3 part_id integer primary key,

4 part_date date,

5 part_dec varchar2(100)

6 )

7 partition by range(part_date)

8 (

9 partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

10 partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

11 partition part_03 values less than(maxvalue) tablespace dw1

12 );

表已创建。

SQL>

SQL> insert into niegc_part values(1,to_date('2005-12-30','yyyy-mm-dd'),'less 20

06-01-01');

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into niegc_part values(2,to_date('2006-01-01','yyyy-mm-dd'),'equal 2

007-01-01');

已创建 1 行。

SQL> commit;

提交完成。

SQL> insert into niegc_part values(3,sysdate,'sysdate');

已创建 1 行。

SQL> commit;

提交完成。

SQL>

SQL> select * from niegc_part partition(part_01);

PART_ID PART_DATE PART_DEC

------------------------------------------

1 30-12月-05 less 2006-01-01

相信只要对oracle 有点熟,都能知道上面的range分区的意思了.

两个字段以上的range分区大同小异,请看下面的例子:

create table niegc_part ( part_id integer primary key, part_date date, part_dec varchar2(100) ) partition by range(part_id,part_date) ( partition part_01 values less than(1,to_date('2006-01-01','yyyy-mm-dd')) tablespace dw, partition part_02 values less than(10,to_date('2007-01-01','yyyy-mm-dd')) tablespace dw, partition part_03 values less than(maxvalue,maxvalue) tablespace dw );

二、Hash分区（散列分区）。散列分区通过指定分区编号来均匀分布数据的一种分区类型，因为通过在I/O设备上进行散列分区，使行这些分区大小一致。如将part_id的数据根据自身的情况散列地存放在指定的三个表空间中：

create table niegc_part

(

part_id integer primary key,

part_date date,

part_dec varchar2(100)

)

partition by hash(part_id)

(

partition part_01 tablespace dw1,

partition part_02 tablespace dw2

);

系统将按part_id将记录散列地插入三个分区中，这里也就是二个不同的表空间中。

三、复合分区。根据范围分区后，每个分区内的数据再散列地分布在几个表空间中，这样我们就要使用复合分区。复合分区是先使用范围分区，然后在每个分区同再使用散列分区的一种分区方法，如将part_date的记录按时间分区，然后每个分区中的数据分三个子分区，将数据散列地存储在三个指定的表空间中：

create table niegc_part

(

part_id integer primary key,

part_date date,

part_dec varchar2(100)

)

partition by range(part_date) subpartition by hash(part_id)

subpartitions 2 store in(dw1,dw2)

(

partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

partition part_03 values less than(maxvalue) tablespace dw1

);

先根据part_date进行范围分区，然后根据交易的ID将记录散列地存储在二个表空间中。

四、索引分区：

注意：对某个字段已做了分区了，是不允许再建立索引分区的。这一点要非常注意。全局索引建立时global子句允许指定索引的范围值，这个范围值为索引字段的范围值：

create index idx_part_id on niegc_part(part_dec)

global partition by range(part_dec)

(

partition idx_1 values less than('1000') tablespace dw,

partition idx_2 values less than(maxvalue) tablespace dw

)

局部索引分区的建立：（注意：表必须存在分区，此分区的个数必须和分区表的分区个数一样，不然是建立不起来的）

create index idx_part_id on niegc_part(part_dec)

local

(

partition idx_1 tablespace dw1,

partition idx_2 tablespace dw2

)

五、分区维护：(只对范围分区)

（1）、增加一个分区：分区范围只能往上增，不能增加一个少于原有的分区：

alter table niegc_part add partition part_03 values less than(maxvalue)

（2）、合并分区：（合并后的分区必须指下最后一个大value的分区）

alter table niegc_part merge partitions part_02,part_03 into partition part_03

（3）、删除一个分区：

alter table niegc_part drop partition part_01

六、总结

需要说明的是，本文在举例说名分区表事务操作的时候，都指定了分区，因为指定了分区，系统在执行的时候则只操作该分区的记录，提高了数据处理的速度。不要指定分区直接操作数据也是可以的。在分区表上建索引及多索引的使用和非分区表一样。此外，因为在维护分区的时候可能对分区的索引会产生一定的影响，可能需要在维护之后重建索引，相关内容请google分区表索引部分的文档。

http://moppet.taobao.com/

分享到：