摘要:在大量业务数据处理的项目中,可以考虑使用分区表来提高应用系统的性能并方便数据管理,本文详细介绍了分区表的使用。
在大型的企业应用或企业级的数据库应用中,要处理的数据量通常可以达到几十到几百GB,有的甚至可以到TB级。虽然存储介质和数据处理技术的发展也很快,但是仍然不能满足用户的需求,为了使用户的大量的数据在读写操作和查询中速度更快,Oracle提供了对表和索引进行分区的技术,以改善大型应用系统的性能。
使用分区的优点:
·增强可用性:如果表的某个分区出现故障,表在其他分区的数据仍然可用;
·维护方便:如果表的某个分区出现故障,需要修复数据,只修复该分区即可;
·均衡I/O:可以把不同的分区映射到磁盘以平衡I/O,改善整个系统性能;
·改善查询性能:对分区对象的查询可以仅搜索自己关心的分区,提高检索速度。
Oracle数据库提供对表或索引的分区方法有三种:
·范围分区
·Hash分区(散列分区)
·复合分区
下面将以实例的方式分别对这三种分区方法来说明分区表的使用。为了测试方便,我们先建三个表空间。
create tablespace dinya_space01
datafile ’/test/demo/oracle/demodata/dinya01.dnf’ size 50M
create tablespace dinya_space01
datafile ’/test/demo/oracle/demodata/dinya02.dnf’ size 50M
create tablespace dinya_space01
datafile ’/test/demo/oracle/demodata/dinya03.dnf’ size 50M
1.1. 分区表的创建
1.1.1. 范围分区
范围分区就是对数据表中的某个值的范围进行分区,根据某个值的范围,决定将该数据存储在哪个分区上。如根据序号分区,根据业务记录的创建日期进行分区等。
需求描述:有一个物料交易表,表名:material_transactions。该表将来可能有千万级的数据记录数。要求在建该表的时候使用分区表。这时候我们可以使用序号分区三个区,每个区中预计存储三千万的数据,也可以使用日期分区,如每五年的数据存储在一个分区上。
根据交易记录的序号分区建表:
SQL> create table dinya_test
2 (
3 transaction_id number primary key,
4 item_id number(8) not null,
5 item_description varchar2(300),
6 transaction_date date not null
7 )
8 partition by range (transaction_id)
9 (
10 partition part_01 values less than(30000000) tablespace dinya_space01,
11 partition part_02 values less than(60000000) tablespace dinya_space02,
12 partition part_03 values less than(maxvalue) tablespace dinya_space03
13 );
Table created.
建表成功,根据交易的序号,交易ID在三千万以下的记录将存储在第一个表空间dinya_space01中,分区名为:par_01,在三千万到六千万之间的记录存储在第二个表空间:
dinya_space02中,分区名为:par_02,而交易ID在六千万以上的记录存储在第三个表空间dinya_space03中,分区名为par_03.
根据交易日期分区建表:
SQL> create table dinya_test
2 (
3 transaction_id number primary key,
4 item_id number(8) not null,
5 item_description varchar2(300),
6 transaction_date date not null
7 )
8 partition by range (transaction_date)
9 (
10 partition part_01 values less than(to_date(’2006-01-01’,’yyyy-mm-dd’))
tablespace dinya_space01,
11 partition part_02 values less than(to_date(’2010-01-01’,’yyyy-mm-dd’))
tablespace dinya_space02,
12 partition part_03 values less than(maxvalue) tablespace dinya_space03
13 );
Table created.
这样我们就分别建了以交易序号和交易日期来分区的分区表。每次插入数据的时候,系统将根据指定的字段的值来自动将记录存储到制定的分区(表空间)中。
当然,我们还可以根据需求,使用两个字段的范围分布来分区,如partition by range ( transaction_id ,transaction_date), 分区条件中的值也做相应的改变,请读者自行测试。
1.1.2. Hash分区(散列分区)
散列分区为通过指定分区编号来均匀分布数据的一种分区类型,因为通过在I/O设备上进行散列分区,使得这些分区大小一致。如将物料交易表的数据根据交易ID散列地存放在指定的三个表空间中:
SQL> create table dinya_test
2 (
3 transaction_id number primary key,
4 item_id number(8) not null,
5 item_description varchar2(300),
6 transaction_date date
7 )
8 partition by hash(transaction_id)
9 (
10 partition part_01 tablespace dinya_space01,
11 partition part_02 tablespace dinya_space02,
12 partition part_03 tablespace dinya_space03
13 );
Table created.
建表成功,此时插入数据,系统将按transaction_id将记录散列地插入三个分区中,这里也就是三个不同的表空间中。
1.1.3. 复合分区
有时候我们需要根据范围分区后,每个分区内的数据再散列地分布在几个表空间中,这样我们就要使用复合分区。复合分区是先使用范围分区,然后在每个分区内再使用散列分区的一种分区方法,如将物料交易的记录按时间分区,然后每个分区中的数据分三个子分区,将数据散列地存储在三个指定的表空间中:
SQL> create table dinya_test
2 (
3 transaction_id number primary key,
4 item_id number(8) not null,
5 item_description varchar2(300),
6 transaction_date date
7 )
8 partition by range(transaction_date)subpartition by hash(transaction_id)
9 subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
10 (
11 partition part_01 values less than(to_date(’2006-01-01’,’yyyy-mm-dd’)),
12 partition part_02 values less than(to_date(’2010-01-01’,’yyyy-mm-dd’)),
13 partition part_03 values less than(maxvalue)
14 );
Table created.
该例中,先是根据交易日期进行范围分区,然后根据交易的ID将记录散列地存储在三个表空间中。
分享到:
相关推荐
VB.NET 或C#中对于直接增删改DataGridView中的记录,用户更易接受,虽然DataGridView本身提供Update的方法(该仅需有Select语句即可)可将添加或删除或更新的的记录同时更新至底层数据库,但该方法模拟Excel的操作,...
开发、报表---帆软:隐藏空行(适用于单条数据)
oracle 12c 下载器 适用于单节点、linux操作系统
适用于单维度和多维数据的超快速简单k均值和实现。 适用于nodejs和浏览器。 安装 npm install skmeans 用法 节点JS const skmeans = require ( "skmeans" ) ; var data = [ 1 , 12 , 13 , 4 , 25 , 21 , 22 , 3 , ...
LTC3562采用恒定频率电流模式架构,在2.7V至5.5V 的输入电压范围内工作,非常适用于单节锂离子/聚合物或多节碱性/镍镉/镍氢金属电池应用。LTC3562有两个通道(600mA和400mA),允许通过在425mV至800mV之间以25mV为...
OPA365具有超低失真(仅为0.0006% THD+N)、极低噪声(仅为4.5nV/rtHz)以及50MHz增益带宽,因而理想地适用于多种设计中的单电源应用,其中包括便携式仪表、数据采集、检试测量、音频以及便携式医疗系统等。 TI负责...
网络游戏-应用于单台多核处理器主机的多线程网络爬虫执行方法.zip
reactsite.github.io 适用于单页面应用程序和静态生成网站的基于React的现代起点
OPA376采用超小型封装,提供25μA低偏移电压(最大值)、5.5MHz大频宽、7.5nV/√Hz低噪声密度和950μA静态电流(最大值)。 以上这些特性使新组件在各项参数间取得平衡,满足滤波、资料采集和单电源处理系统的交流和...
DAO (Data Access Objects) 数据访问对象是第一个面向对象的接口,它显露了 Microsoft Jet 数据库引擎(由 Microsoft Access 所使用),并允许 Visual Basic ...DAO 最适用于单系统应用程序或小范围本地分布使用。
目前的人脸特征匹配算法大多关注于单图像与单图像的匹配而不能有效利用图像序列之间的相关信息, 因而提出了一种基于深度学习与约束稀疏表达的人脸特征匹配算法.通过 CNN 网络对人脸图像进行特征提取, 并利用...
尽管电压测量已经单独被用于许多便携式产品估算电池的剩余电量,但是这种方法可能存在高达50% ...
Lisa是一种用于部署到一台或多台服务器并在其上远程运行任务的工具,类似于Capistrano或Mina,但完全用Java编写。 她使用简单,干净的JSON文件进行配置,并提供了对日志文件尾部,运行远程控制台甚至监视服务器的开...
本程序适用于单交点对称型、不对称型、无缓和曲线单圆曲线型一个交点范围内(含交点前后有直线段时)的曲线要素核对和坐标正反算,手工输入要素,对设计图纸的“直线、曲线转角表”中交点数据进行复核验证,并能对...
从系统维护与运行上讲,该系统不能在线对功能进行升级,只适用于单 机运行。 图书信息管理系统的开发是一项细腻而又复杂的工作,所以它要求设计者要 有总体规划的能力,还要有百倍的耐心去做,在设计方面一点都不能...
数据库: 系统可能使用MySQL、PostgreSQL或其他关系型数据库来存储数据,通过JPA (Java Persistence API) 或者MyBatis等ORM (Object-Relational Mapping) 工具与Spring Boot集成,实现数据的持久化。中间件: 为了提高...
根据高速、高精度锁相环抖动测量的需要,在基于单相位数据转换跟踪环的抖动测试模型的基础下,提出一种基于Xilinx芯片的多相位数据转换跟踪环的抖动测试算法。根据这两种方法的抖动测试模型,比较各自的抖动误差...
全部备份指当在同一个数据库中安装由其它系统的数据库时可以选择此项对其它系统的数据表及数据实现完全备份。 优化:指当然数据表中出现碎片时,可以通过此项操作实现碎片的相对清除。 修复:指当数据表出现...
(2)可重定位装入方式 绝对装入方式只能将目标模块装入到内存中事先指定的位置,这只适用于单道程序环境。而在多道程序环境下,编译程序不可能预知经编译后所得到的目标模块应放在内存的何处。因此,对于用户程序...
软件主要适用于单导线差主要适用于各种导线、导线网的观测记录及平差计算。包括平面及高程的平差。 1.观测记录。有导线观测记录、水平角观测记录及水准观测记录