`

Oracle表分区和索引分区

阅读更多

表空间及分区表的概念

表空间:
是一个或多个数据文件的集合,所有的数据对象都存放在指定的表空间中,但主要存放的是表, 所以称作表空间。
 
分区表:
当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。
表分区的具体作用
Oracle的表分区功能通过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。通常,分区可以使某些查询以及维护操作的性能大大提高。此外,分区还可以极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。
 
分区功能能够将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫做分区。每个分区有自己的名称,还可以选择自己的存储特性。从数据库管理员的角度来看,一个分区后的对象具有多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有相当大的灵活性。但是,从应用程序的角度来看,分区后的表与非分区表完全相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。

 

分区概述

    为了简化数据库大表的管理,例如在数据仓库中一般都是TB级的数量级.ORACLE8以后推出了分区选项.分区将表分离在若于不同的表空间上,用分而治之的方法来支撑无限膨胀的大表,增强大表在物理一级的可管理性.将大表分割成较小的分区可以改善表的维护、备份、恢复、事务及查询性能。

 

什么时候使用分区表:
1、表的大小超过2GB。
2、表中包含历史数据,新的数据被增加都新的分区中。

 

分区的优点:

1、  增强可用性:如果表的一个分区由于系统故障而不能使用,表的其余好的分区仍可以使用;

2、  减少关闭时间:如果系统故障只影响表的一部份分区,那么只有这部份分区需要修复,矿能比整个大表修复花的时间更少;

3、  维护轻松:如果需要得建表,独产管理每个公区比管理单个大表要轻松得多;

4、  均衡I/O:可以把表的不同分区分配到不同的磁盘来平衡I/O改善性能;

5、  改善性能:对大表的查询、增加、修改等操作可以分解到表的不同分区来并行执行,可使运行速度更快,在数据仓库的TP查询特别有用。

6、  分区对用户透明,最终用户感觉不到分区的存在。  

 

 

create tablespace dw1 datafile 'D:\oracle\oradata\ora9\dw11.ora' size 50M create tablespace dw2 datafile 'D:\oracle\oradata\ora9\dw21.ora' size 50M


   

一、按范围分区:固名思义就是按一定range来分区,看下面的例子:

 

SQL> set linesize 1000

SQL> create table niegc_part

  2  (

  3  part_id integer primary key,

  4  part_date date,

  5  part_dec varchar2(100)

  6  )

  7  partition by range(part_date)

  8  (

  9  partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

 10  partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

 11  partition part_03 values less than(maxvalue) tablespace dw1

 12  );

 

表已创建。

 

SQL>

SQL> insert into niegc_part values(1,to_date('2005-12-30','yyyy-mm-dd'),'less 20

06-01-01');

 

已创建 1 行。

 

SQL> commit;

 

提交完成。

 

SQL> insert into niegc_part values(2,to_date('2006-01-01','yyyy-mm-dd'),'equal 2

007-01-01');

 

已创建 1 行。

 

SQL> commit;

 

提交完成。

 

SQL> insert into niegc_part values(3,sysdate,'sysdate');

 

已创建 1 行。

 

SQL> commit;

 

提交完成。

 

SQL>

SQL>

SQL> select * from niegc_part partition(part_01);

 

   PART_ID PART_DATE  PART_DEC

------------------------------------------

         1 30-12-05 less 2006-01-01

 

相信只要对oracle 有点熟,都能知道上面的range分区的意思了.

 

两个字段以上的range分区大同小异,请看下面的例子:

create table niegc_part ( part_id integer primary key, part_date date, part_dec varchar2(100) ) partition by range(part_id,part_date) ( partition part_01 values less than(1,to_date('2006-01-01','yyyy-mm-dd')) tablespace dw, partition part_02 values less than(10,to_date('2007-01-01','yyyy-mm-dd')) tablespace dw, partition part_03 values less than(maxvalue,maxvalue) tablespace dw );



 

 

 

 

 

二、Hash分区(散列分区) 散列分区通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使行这些分区大小一致。如将part_id的数据根据自身的情况散列地存放在指定的三个表空间中:

create table niegc_part

(

part_id integer primary key,

part_date date,

part_dec varchar2(100)

)

partition by hash(part_id)

(

partition part_01  tablespace dw1,

partition part_02  tablespace dw2

);

 

系统将按part_id将记录散列地插入三个分区中,这里也就是二个不同的表空间中。 

 

 

三、复合分区。根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区同再使用散列分区的一种分区方法,如将part_date的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:

 

create table niegc_part

(

part_id integer primary key,

part_date date,

part_dec varchar2(100)

)

partition by range(part_date) subpartition by hash(part_id)

subpartitions 2 store in(dw1,dw2)

(

partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dw1,

partition part_02 values less than(to_date('2007-01-01','yyyy-mm-dd')) tablespace dw2,

partition part_03 values less than(maxvalue) tablespace dw1

);

  

先根据part_date进行范围分区,然后根据交易的ID将记录散列地存储在二个表空间中。 

 

四、索引分区:

注意: 对某个字段已做了分区了,是不允许再建立索引分区的。这一点要非常注意。全局索引建立时global子句允许指定索引的范围值,这个范围值为索引字段的范围值:

 

create index idx_part_id on niegc_part(part_dec)

global partition by range(part_dec)

(

partition idx_1 values less than('1000') tablespace dw,

partition idx_2 values less than(maxvalue) tablespace dw

) 

 

局部索引分区的建立:(注意:表必须存在分区,此分区的个数必须和分区表的分区个数一样,不然是建立不起来的)

create index idx_part_id on niegc_part(part_dec)

local

(

partition idx_1 tablespace dw1,

partition idx_2 tablespace dw2

)

 

 

五、分区维护:(只对范围分区)

1)、增加一个分区:分区范围只能往上增,不能增加一个少于原有的分区:

alter table niegc_part add partition part_03 values less than(maxvalue)

2)、合并分区:(合并后的分区必须指下最后一个大value的分区)

alter table niegc_part merge partitions part_02,part_03 into  partition part_03

3)、删除一个分区:

alter table niegc_part drop partition part_01

 

 

六、总结

需要说明的是,本文在举例说名分区表事务操作的时候,都指定了分区,因为指定了分区,系统在执行的时候则只操作该分区的记录,提高了数据处理的速度。不要指定分区直接操作数据也是可以的。在分区表上建索引及多索引的使用和非分区表一样。此外,因为在维护分区的时候可能对分区的索引会产生一定的影响,可能需要在维护之后重建索引,相关内容请google分区表索引部分的文档。

 

http://moppet.taobao.com/

 

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics