`
ccii
  • 浏览: 54956 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

Oracle分区表

    博客分类:
  • DB
阅读更多
1. 分区表简介
    当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会下降,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个表空间(物理文件上),这样查询数据时,不至于每次都扫描整张表。分区后的表与未分区的表在执行DML语句时没有任何区别。对表进行分区时,必须为表中的每一条记录指定所属分区,一条记录属于哪一分区是由分区表对该记录的匹配字段决定的,分区字段可以是表中一个字段或多个字段的组合,在创建分区表时确定。当用户对分区表进行插入、更新或删除等操作时,Oracle会自动根据分区字段的值来选择存储的分区。

2. 分区表的优缺点
优点:
(1)改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。
(2)增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用。
(3)维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可。
(4)均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能。
缺点:
(1)分区表相关:已经存在的表没有方法可以直接转化为分区表,不过 Oracle 提供了在线重定义表的功能。
什么时候使用分区表:
(1)表的大小超过2GB。
(2)表中包含历史数据,新的数据被增加都新的分区中。

3. 创建分区表
(1)范围分区
    范围分区将数据表中某个字段的范围作为分区键进行分区,这种分区方式是最为常用的,并且分区键经常采用日期。举个例子:你可能会将销售数据按照月份进行分区。
    当使用范围分区时,请考虑以下几个规则:
    a. 每一个分区都必须有一个VALUES LESS THEN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
    b. 所有分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
    c. 在最高的分区中,MAXVALUE被定义。MAXVALUE代表了一个不确定的值。这个值高于其它分区中的任何分区键的值,也可以理解为高于任何分区中指定的VALUE LESS THEN的值,同时包括空值。

例一:
假设有一个CUSTOMER表,表中有数据300000行,我们将此表通过CUSTOMER_ID进行分区,CUSTOMER_ID为从0自增长整数,每个分区存储100000行,我们将每个分区保存到单独的表空间中,这样数据文件就可以跨越多个物理磁盘。下面是创建表和分区的代码,如下:

CREATE TABLE customer.CUSTOMER
(
    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
    FIRST_NAME  VARCHAR2(30) NOT NULL,
    LAST_NAME   VARCHAR2(30) NOT NULL,
    PHONE        VARCHAR2(15) NOT NULL,
    EMAIL        VARCHAR2(80),
    STATUS       CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
    PARTITION CUS_PART1 VALUES LESS THAN (100000),
    PARTITION CUS_PART2 VALUES LESS THAN (200000),
    PARTITION CUS_PART2 VALUES LESS THAN (maxvalue)
)

查询表customer.CUSTOMER中的所有数据:
SELECT * FROM customer.CUSTOMER;
查询第二个分区的数据:
SELECT * FROM customer.CUSTOMER PARTITION(CUS_PART2);

例二:按时间划分
CREATE TABLE ORDER_ACTIVITIES
(
    ORDER_ID      NUMBER(7) NOT NULL,
    ORDER_DATE    DATE,
    TOTAL_AMOUNT NUMBER,
    CUSTOTMER_ID NUMBER(7),
    PAID           CHAR(1)
)
PARTITION BY RANGE (ORDER_DATE)
(
  PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACE ORD_TS01,
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02,
  PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03
)

(2)散列分区
    这类分区是在列值上使用散列(HASH)算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。

例:
CREATE TABLE HASH_TABLE
(
  COL NUMBER(8),
  INF VARCHAR2(100)
)
PARTITION BY HASH (COL)
(
  PARTITION PART01 TABLESPACE HASH_TS01,
  PARTITION PART02 TABLESPACE HASH_TS02,
  PARTITION PART03 TABLESPACE HASH_TS03
)

简写:
CREATE TABLE emp
(
    empno NUMBER (4),
    ename VARCHAR2 (30),
    sal   NUMBER
)
PARTITION BY  HASH (empno) PARTITIONS 8 STORE IN (emp1,emp2,emp3,emp4,emp5,emp6,emp7,emp8);

     hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪个分区中,hash算法中最重要的是hash函数,Oracle中如果你要使用hash分区,只需指定分区的数量即可。建议分区的数量采用2的n次方,这样可以使得各个分区间数据分布更加均匀。

(3)列表分区
    列表分区适用于分区列的值为非数字或日期数据类型,并且分区列的取值范围较少时使用。

例一:
CREATE TABLE PROBLEM_TICKETS
(
    PROBLEM_ID   NUMBER(7) NOT NULL PRIMARY KEY,
    DESCRIPTION  VARCHAR2(2000),
    CUSTOMER_ID  NUMBER(7) NOT NULL,
    DATE_ENTERED DATE NOT NULL,
    STATUS       VARCHAR2(20)
)
PARTITION BY LIST (STATUS)
(
      PARTITION PROB_ACTIVE   VALUES ('1', '2') TABLESPACE PROB_TS01,
      PARTITION PROB_INACTIVE VALUES ('3') TABLESPACE PROB_TS02
);

(4)组合范围散列分区
    这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,然后再按某列进行列表分区,分区之中的分区被称为子分区。

例一:
CREATE TABLE SALES
(
PRODUCT_ID VARCHAR2(5),
SALES_DATE DATE,
SALES_COST NUMBER(10),
STATUS VARCHAR2(20)
)
PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS)
(
   PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009
          (
              SUBPARTITION P1SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
              SUBPARTITION P1SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
          ),
   PARTITION P2 VALUES LESS THAN (TO_DATE('2003-03-01','YYYY-MM-DD')) TABLESPACE rptfact2009
          (
              SUBPARTITION P2SUB1 VALUES ('ACTIVE') TABLESPACE rptfact2009,
              SUBPARTITION P2SUB2 VALUES ('INACTIVE') TABLESPACE rptfact2009
          )
)

(5)组合范围列表分区
    组合范围列表分区同组合范围散列分区类似。这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,然后再按某列进行散列分区。

4. 建立分区表索引
(1)局部分区索引
    局部分区索引是指为分区表的各个分区单独建立的索引,各个分区索引之间是相互独立的。为分区表创建局部分区索引后,Oracle将会自动对表的分区和索引的分区进行同步管理。
    如果为分区表添加新的分区,则Oracle会自动为新分区建立新的索引。如果表的分区还存在,则用户不能删除其所对应的索引分区。如果删除表的分区,则系统会自动删除其对应的索引分区。建立局部分区索引需要使用LOCAL关键字。例:

首先创建表和分区:
CREATE TABLE customer.CUSTOMER
(
    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
    FIRST_NAME  VARCHAR2(30) NOT NULL,
    LAST_NAME   VARCHAR2(30) NOT NULL,
    PHONE        VARCHAR2(15) NOT NULL,
    EMAIL        VARCHAR2(80),
    STATUS       CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
    PARTITION CUS_PART1 VALUES LESS THAN (100000),
    PARTITION CUS_PART2 VALUES LESS THAN (200000),
    PARTITION CUS_PART2 VALUES LESS THAN (maxvalue)
)
然后创建局部分区索引:
CREATE INDEX customer.CUSTOMER_INDEX ON customer.CUSTOMER(CUSTOMER_ID) LOCAL
(
    PARTITION INDEX1,
    PARTITION INDEX2,
    PARTITION INDEX3
);

(2)全局分区索引
    全局分区索引是指对整个分区表建立的索引,Oracle会对索引进行分区。全局分区索引的各个分区之间不是相互独立的,分区索引和分区表之间也不是简单的一对一关系。建立全局分区索引需要使用GLOBAL关键字,而且只能进行RANGE分区。例:
首先创建表和分区:
CREATE TABLE customer.CUSTOMER
(
    CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY,
    FIRST_NAME  VARCHAR2(30) NOT NULL,
    LAST_NAME   VARCHAR2(30) NOT NULL,
    PHONE        VARCHAR2(15) NOT NULL,
    EMAIL        VARCHAR2(80),
    STATUS       CHAR(1)
)
PARTITION BY RANGE (CUSTOMER_ID)
(
    PARTITION CUS_PART1 VALUES LESS THAN (100000),
    PARTITION CUS_PART2 VALUES LESS THAN (200000),
    PARTITION CUS_PART2 VALUES LESS THAN (maxvalue)
)
然后创建全局分区索引:
CREATE INDEX customer.CUSTOMER_INDEX ON customer.CUSTOMER(CUSTOMER_ID)
GLOBAL PARTITION BY RANGE(CUSTOMER_ID)
(
    PARTITION INDEX1 VALUES LESS THAN (100000),
    PARTITION INDEX2 VALUES LESS THAN (200000),
    PARTITION INDEX3 VALUES LESS THAN (maxvalue)
);

(3)全局非分区索引
    全局非分区索引是指对整个分区表建立的索引,但是未对索引进行分区。例:
CREATE INDEX customer.CUSTOMER_INDEX ON customer.CUSTOMER(CUSTOMER_ID);

5. 管理分区表
(1)添加分区
    为范围分区表增加分区:
    在最后一个分区之后增加分区(如果范围分区表中最后一个分区使用了MAXVALUE关键字,那么将无法在该分区表的最后一个分区中增加新分区):
    ALTER TABLE customer.CUSTOMER ADD PARTITION P3 VALUES LESS THAN(300000);  // 注意:以上添加的分区界限应该高于最后一个分区界限。
    在分区中间或开始处增加分区:
    ALTER TABLE customer.CUSTOMER SPLIT PARTITION P2 AT(150000) INTO(PARTITION P24, PARTITION P26);  // 将P2分区分从150000分成P24、P26两个分区。

    为散列分区表增加分区:
    ALTER TABLE customer.CUSTOMER ADD PARTITION P4 ;  // Oracle会自动在已有分区和新建分区之间进行容量均衡

    为列表分区表增加分区:
    ALTER TABLE customer.CUSTOMER ADD PARTITION P5 VALUES('4') ;  // 和创建分区表时一样需要为分区使用VALUES子名指定取值列表
   
    添加子分区:
    ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE');

(2)合并分区
    合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。以下代码实现了P1 P2分区的合并:
    ALTER TABLE SALES MERGE PARTITIONS P1,P2 INTO PARTITION P2;

(3)删除分区
    以下代码删除了P3表分区:
    ALTER TABLE SALES DROP PARTITION P3;
    在以下代码删除了P4SUB1子分区:
    ALTER TABLE SALES DROP SUBPARTITION P4SUB1;
    注意:如果删除的分区是表中唯一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。

(4)截断分区
    截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即使只有一个分区时,也可以截断该分区。通过以下代码截断分区:
    ALTER TABLE SALES TRUNCATE PARTITION P2;
    通过以下代码截断子分区:
    ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2;

(5)拆分分区
    拆分分区将一个分区拆分两个新分区,拆分后原来分区不再存在。注意不能对HASH类型的分区进行拆分。
    ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22);

(6)接合分区(coalesca)
    接合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,可以增加散列分区,然后进行接合,值得注意的是,接合分区只能用于散列分区中。通过以下代码进行接合分区:
    ALTER TABLE SALES COALESCA PARTITION;

(7)重命名表分区
    以下代码将P21更改为P2:
    ALTER TABLE SALES RENAME PARTITION P21 TO P2;

(8)相关查询
    跨分区查询:
    select sum( *) from (select count(*) cn from t_table_SS PARTITION (P200709_1) union all select count(*) cn from t_table_SS PARTITION (P200709_2));

    查询表上有多少分区:
    SELECT * FROM USER_TAB_PARTITIONS WHERE TABLE_NAME='tableName';

    查询分区中的数据:
    select * from tablename partition(partitionname);

    查询索引信息:
        select object_name,object_type,tablespace_name,sum(value)
        from v$segment_statistics
        where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'
        group by object_name,object_type,tablespace_name
        order by 4 desc;

    显示数据库所有分区表的信息:
        select * from DBA_PART_TABLES;

    显示当前用户可访问的所有分区表信息:
        select * from ALL_PART_TABLES

    显示当前用户所有分区表的信息:
        select * from USER_PART_TABLES

    显示表分区信息 显示数据库所有分区表的详细分区信息:
        select * from DBA_TAB_PARTITIONS

    显示当前用户可访问的所有分区表的详细分区信息:
        select * from ALL_TAB_PARTITIONS

    显示当前用户所有分区表的详细分区信息:
        select * from USER_TAB_PARTITIONS

    显示子分区信息 显示数据库所有组合分区表的子分区信息:
        select * from DBA_TAB_SUBPARTITIONS

    显示当前用户可访问的所有组合分区表的子分区信息:
        select * from ALL_TAB_SUBPARTITIONS

    显示当前用户所有组合分区表的子分区信息:
        select * from USER_TAB_SUBPARTITIONS

    显示分区列 显示数据库所有分区表的分区列信息:
        select * from DBA_PART_KEY_COLUMNS

    显示当前用户可访问的所有分区表的分区列信息:
        select * from ALL_PART_KEY_COLUMNS

    显示当前用户所有分区表的分区列信息:
        select * from USER_PART_KEY_COLUMNS

    显示子分区列 显示数据库所有分区表的子分区列信息:
        select * from DBA_SUBPART_KEY_COLUMNS

    显示当前用户可访问的所有分区表的子分区列信息:
        select * from ALL_SUBPART_KEY_COLUMNS

    显示当前用户所有分区表的子分区列信息:
        select * from USER_SUBPART_KEY_COLUMNS

    怎样查询出oracle数据库中所有的的分区表:
        select * from user_tables a where a.partitioned='YES'

(9)删除分区数据
    删除一个表的数据:
    truncate table table_name;
   
    删除分区表一个分区的数据:
    alter table table_name truncate partition p5;

3
1
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics