`
talentluke
  • 浏览: 592228 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

数据库物理分布设计

 
阅读更多

概述
我们无论使用哪种数据库,无论怎样设计数据库,我想都会遵从一个原则:数据安全性和性能高效这两个主要方面,但是关于这两个方面的话题太多,在这里就不一 一陈述,我只是从数据库物理分布设计方面和大家一起简单的探讨一下。因为数据库良好的物理分布设计也是对数据安全性和性能高效影响比较大, 就象我们在建大楼之前一定要先打好地基一样。
現实中我们在应用各种不同数据库的时候,往往会忽略数据库的物理布局,只有在数据库性能遇到问题的时候才去考虑,但这是得不偿失的,这样一来不仅会导致与 设计相关的问题出现,而且会影响性能的调整效果,所以我们在创建数据库之前先进行规划数据库的物理布局也是很必要的,这也符合人们常说的”磨刀不误砍柴 工”的道理。下面我就以Oracle为例从优化操作系统、磁盘布局优化和配置、数据库初始化参数的选择、设置和管理内存、设置和管理CPU、设置和管理表空间、设置和管理回滚段、设置和管理联机重做日志、设置和管理归档重做日志、设置和管理控制文件等几个方面作以陈述。

一. 优化操作系统
为了获得最佳的服务器性能, 对操作系统的优化也是很必要的, 因为操作系统性能问题通常会涉及到进程管理、内存管理、调度等,所以用户需要确保有足够的I/O带宽、CPU的处理能力、交换空间来尽可能的降低系统时 间。如果应用程序在缓冲区出现过多的”忙”等待, 那么系统调用的进程将会增加, 虽然可以通过优化SQL语句等方法来降低调用的数目,但是这也是治病不治根的。用户可以启动Oracle的初始化参数timed_statistics来 增加系统调用的数目, 反之如果关闭此参数,那么系统调用的数目也会减少。操作系统的缓存和Oracle自己的缓存管理是不相冲突的, 虽然它能消耗一定的资源, 但是它对性能还是有一定好处的, 因为一般所有数据库的I/O需要通过系统文件缓存来访问文件存储器。
Oracle的操作可能会用到许多的进程(有的系统叫线程), 所以用户应该确保所有Oracle的进程、后台进程、用户进程具有相同的优先级, 否则就会产生恶化的现象, 导致高优先级的进程等待低优先级的进程处理完毕释放出CPU资源后再处理, 更不能将Oracle的后台进程绑定到CPU中, 这样一来也会导致被绑定的进程被CPU资源饿死。
比较好的是有些操作系统提供有操作系统资源管理器(Operating System Resource Manager), 通过它可以对系统资源访问划分优先级来降低峰值负载模式的影响,来实现多种管理策略和方法,控制用户资源的访问,限制用户资源的可消耗量。

二.磁盘布局优化和配置
在大多数产品数据库应用中,数据库文件一般都放在磁盘上,因此磁盘的良好使用和布局也是很重要的。磁盘布局的目标是:磁盘性能是不能阻碍实现数据库性能, 数据库磁盘必须专用于数据库文件,否则非数据库将会影响到该数据库,且这种影响是不可预测的; 系统硬件和镜像必须满足恢复和性能的要求,数据文件大小和I/O不能超过磁盘的大小和I/O,数据库一定是可以恢复的,必须使后台进程之间的竞争最小化。 在规划硬盘配置时也要注意:首先所用的磁盘容量,有时用多个容量小的磁盘比用一个大的磁盘效果更好,因为可以进行更高级的并行I/O操作; 其次磁盘的速度,如反应时间和寻道时间都将影响I/O的性能, 可以考虑使用合适的文件系统作为数据文件; 再者使用合适的RAID。
RAID(Redundant Arrays of Inexpensive Disks)廉价冗余阵列可以改善数据的可靠性,而I/O的性能又取决于RAID配置的方式:RAID1可以提供比较好的可靠性和较快的读取速度,但写的 代价比较大,所以不适合频繁写的应用;RAID0+1在原RAID1的基础上读取的速度更快,所以这也是大家常会选择的方式;RAID5可以提供比较好的 可靠性,有顺序的读操作比较适合这种方式,但性能会受到影响,对于写操作频繁的应用也不适合这种。对于该选择那种方式不能一概而论,要根据具体的情况而 定。
有些应用软件先天性受到磁盘的I/O限制, 所以在设计的时候应尽量使Oracle的性能不受I/O的限制, 所以在设计一个I/O系统时要考虑以下的数据库需要: 存储磁盘的最小字节; 可用性, 如24X7, 9X5; 性能如I/O的输出和响应时间。决定Oracle文件的I/O统计信息可以来查询下列: 物理读数量(V$filestat.phyrds)、物理写数量(V$filestat.phywrites)、平均时间, I/O=物理读+物理写。而I/O的平均数量=(物理读+物理写)/共用秒数), 估计这个数据对于新系统是有用的, 可以查询出新应用程序的I/O需求与系统的I/O能力是否匹配以便及时调整。

三.创建数据库初始化参数的选择
管理数据库的第一阶段就是初始化数据库的创建,尽管可以在数据库创建好以后再来调整性能,但是有些参数是不能修改的或很难修改,比 如:Db_block_size、Db_name、Db_domain、Compatible、Nls_language、 Nls_characterset、Nls_nchar_characterset。
Db_block_size参数决定Oracle数据库块的大小,一般可以选择的范围是2K、4K、8K、16K、32K,使用下一个较大值数据库块大小 的效果一般可以集中查询中性能提高50%。但是按常规来说对于一般服务器不提倡把这个值设的很大,小型机除外,因为这样一来数据库块中将会有更多的行,在 数据库维护期间发生块级竞争的可能性比较大,避免这种竞争的办法是在表级和索引级增大Freelists、maxtrans和initrans的设置值, 通常Freelists设置为大于4会带来更多的好处。
Db_name该参数指定一个数据库标识符,一般在Create Database中指定的名称,改参数是可选的(在Oracle9i实时应用集群时是必选的,多个实例有相同的参数值),但是建议在Create Database之前设置它,如果不指定则要出现在Startup或Alter Database mount命令中。
Db_domain该参数指定全局数据库名的扩展部分,在Oracle9i实时应用集群时是必选的,多个实例有相同的参数值。
Compatible该参数指定Oracle服务器维护版本的兼容性,保证与早期的版本向下兼容的时候允许用户使用新的版本,在Oracle9i实时应用集群时是必选的,多个实例有相同的参数值。
Nls_language和Nls_characterset及Nls_nchar_characterset三个参数是数据库的字符集参数,在数据库创建完成后一般也不能改变或很难改变,所以在创建数据库的时候要先设置好。

四.设置和管理内存
Oracle使用共享内存来管理其内存和文件结构,Oracle常使用的内存结构如下:
系统全局区(System Global Area,SGA),SGA随着不同的环境而不同,没有一种普通的最佳方案,我们在设置它直前要先考虑以下的几个方面:物理内存多大;操作系统是那种及占 多大的内存,数据库系统是文件系统还是裸设备;数据库运行的模式。SGA包括:Fixed size、Variable size、Database Buffers、Redo Buffers。SGA占有物理内存的比例没有严格的规定,只能遵从一般的规则:SGA占据物理内存的40%--60%左右。如果通过直观的公式化来表达 则为:OS使用内存+SGA+并发进程数*(Sort_area_size+Hash_area_size+2M)<0.7RAM,这个公式也只是 参考,不必拘于此,实际情况可以自由发挥。初始化参数文件中的一些参数对SGA的大小有决定性的影响。参数Db_block_Buffers(SGA中存 储区高速缓存的缓冲区数目),参数Shared_pool_size(分配给共享SQL区的字节数),是SGA大小的主要影响者。Database Buffers 参数是SGA大小和数据库性能的最重要的决定因素。该值较高,可以提高系统的命中率,减少I/O。每个缓冲区的大小等于参数Db_block_size的 大小。Oracle数据库块以字节表示大小。Oracle SGA区共享池部分由库高速缓存、字典高速缓存及其他一些用户和服务器会话信息组成,共享池是最大的消耗成分。调整SGA区各个结构的大小,可以极大地提 高系统的性能。
数据块缓冲缓存区(Data block buffers cache),Data buffers在8i中是Db_block_buffers*Db_block_size,9i中用Db_cache_size来代替这个参数。在内存的 配置中把别的参数设置完成后,应该把能给的都给Data buffers。Oracle 在运行期间向数据库高速缓存读写数据,高速缓存命中表示信息已在内存中,高速缓存失败意味着Oracle必需进行磁盘I/O。保持高速缓存失败率最小的关 键是确保高速缓存的大小。Oracle8i中初始化参数Db_block_buffers控制数据库缓冲区高速缓存的大小。可通过查询V$sysstat 命中率,以确定是否应当增加Db_block_buffers的值。
  SELECT name,value FROM V$sysstat
  WHERE name in (’dbblock gets’,’consistent gets’,’physical reads’);
通过查询结果命中率=1-physical reads/(dbblock gets+consistent gets) 如果命中率<0.6~0.7,则应增大Db_block_buffers。
字典缓存区(Dictionary CACHE),数据字典缓存区的大小由数据库内部管理,大小由参数Shared_pool_size来设置。数据字典高速缓存包括了有关数据库的结构、用 户、实体信息等。数据字典的命中率对系统有很大的影响。命中率的计算中,getmisses 表示失败次数,gets表示成功次数。查询V$ROWCACHE表:
  SELECT (1-(SUM(getmisses)/(SUM(gets)+SUM(getmisses))))*100
  FROM V$rowcache;
如果该值>90%,说明命中率合适。否则,应增大共享池的大小。
重做日志缓冲区(Read log buffer),下面将有陈述,在此就不做说明。
SQL共享池(Shared pool size),该共享池包括包括执行计划及针对数据库执行SQL语句的语法分析用的,在第二次运行相同的SQL语句时可用SQL中的语法分析来加快执行速 度。如果它太小,语句会连续不断地再装入到库缓存区,从而影响性能。可以通过Alter system命令来修改此参数,9I以后的版本可以动态地修改其大小。
大池(Large pool size),是一个可选的内存区。如果选择可对数据库象备份/恢复这些大的操作提高性能。如果不选择此参数,则系统会使用共享池。
JAVA池(Java pool size),由其名字而言可知,是为满足JAVA命令语法分析的需求。在UNIX系统中如果区组的大小为4MB,则默认大小应该为24M,如果区组大小为 16MB,则默认大小为32M。如果数据库没有使用JAVA,则保持在10M—20M足够。
多缓冲区池(Multiple buffer pools),可以使用多缓冲区池把大数据集与应用的剩余部分分开,以减少它们争夺缓存区内相同资源的可能性,创建时需要在初始化参数中设定其大小。
程序全局区(Program global area,PGA)是Oracle的一个私有的内存区,9i以后的版本中,如果Workarea_size_policy=auto,则所有的会话共用一 块内存,该内存在参数Pga_aggregate_target设置,它的一个好的初始设置是:对于一个OLTP系统 Pga_aggregate_target=(totalL_mem*80%)*20%;对于一个DSS系统Pga_aggregate_target= (total_mem*80%)*50%。这里的total_mem是物理内存。在调整Pga_aggregate_target参数时,下面的几个动态 视图会有帮助的:V$sysstat和 V$sesstat;V$sql_workarea_active;V$pgastat;V$sql_workarea; V$process。

五.设置和管理CPU
    在设置和安装数据库的过程中,基本不用对CPU做什么配置的,系统会自动默认的,但是在管理过程中我们可以利用操作系统监控工具来监控CPU的状况。例如 在UNIX系统中,可以运行sar–u的工具来检查整个系统使用CPU的水平。其统计信息包括:用户时间、系统时间、空闲时间、I/O等待时间。在正常工 作负载的情况下,如果空闲时间和I/O等待时间接近于0或少于5%,那就表示CPU的使用存在问题。
对于Windows系统可以通过性能监视器(Performance monitor)来检查CPU的使用状况可以提供以下信息:处理器时间、用户时间、特权时间、中断时间、DPC时间。
如果CPU的使用存在问题,则可以通过以下的方式来解决:优化系统和数据库;增加硬件的能力;对CPU资源分配进行划分优先级,Oracle数据库资源管理器(Database Resource Manager)负责在用户和应用程序之间分配和管理CPU资源。

六.设置和管理表空间
    数据库文件之间的I/O竞争是数据库之大忌, 所以对数据库规划之前要先对数据文件的I/O进行初步的评估, 通常情况下, 应用的产品数据库表所在的表空间会很活跃, 索引表空间和数据字典之类的表空间也很活跃的, 对于事物比较频繁的应用中, 重做表空间也很活跃的, 所以对不同类型的数据库其数据文件的I/O竞争也会略有不同的, 但是基本上还是遵从以下的原则比较好: 应用的表和索引通常应该被分配或分区到多个表空间中, 以降低单个数据文件的I/O, 最好把每一种功能相同的区域对象建立单独的表空间; 没有理由把除数据字典表和系统回退段外的其他东西放到系统表空间中, 要把能移出系统表空间的对象都移出; 索引段不应该和相关表放在同一表空间中, 因为他们在数据管理和查询时会产生很多的并发I/O; 临时表空间是用以存储大量的排序, 所以其它的应用对象是不能放在临时表空间。
以上讲的是数据库文件分布的原理, 原理归原理, 事实应用中, 我们还是以经验来设置分布比较好些, 当然在没有经验之前还是参考原理以致于不会走弯路。
数据库和表空间可以是一对多的关系,表空间和数据文件也可以是一对多的关系,数据文件和数据对象也可以是一对多的关系。当创建一个数据对象(如表或索引) 时,可以通过默认值或特殊命令将其赋予一个表空间,这样就会在该表空间中创建一个段(Segment)来存储与该对象有关的数据。一个段由一些称作区间 (Extent,一组连续的Oracle块)的区段组成,一但现有的区段不能存储数据时,这个段就要获得另一个区间来支持将数据插入到对象中。因此这个段 所使用的空间由它的参数决定的,这些参数可以在创建时指定,也可以在以后更改。如在Create table,Create index,Create cluster,Create rollback segment命令中没有指定存储参数,则数据库会默认它存储所在的表空间的参数,这些参数有 initial,next,pctincrease,maxextents,minextents等。在创建后不能修改initial和 minextents值,每个表空间的存储参数默认值可以在Dba_tablespaces视图中查询出来。
磁盘I/O是系统性能的瓶颈,解决好磁盘I/O,可明显提高性能。通过查询V$filestat可以知道每个物理文件的使用频率(phyrds表示每个数据文件读的次数,phywrts表示每个数据文件写的次数)
  SELECT name,phyrds,phywrts FROM V$datafile df,V$filestat fs
  WHERE df.file# =fs.file#;
对于使用频率较高的物理文件,可以采用以下策略: 将I/O尽可能平均分配在尽可能多的磁盘上;为表和索引建立不同的表空间;将数据文件与重做日志文件分离在不同的磁盘上;减少不经Oracle server的磁盘I/O。
如果大家没有经验的情况下不小心把数据文件规划的不恰当, 以致于产生了大量的I/O竟争现象, 那么就要根据上面的原则重新调整数据文件的分布, 以平衡数据文件之间的I/O竟争, 具体如何移动数据文件, 各种数据库的方法不尽相同, 但是基本的原理还是相同的,下面是针对Oracle8i如何移动数据文件的两种方法的举例(9i略有不同):
第一种方法﹕(Alter database)
关闭数据库-移动数据库文件-装载并改名-启动

分享到:
评论

相关推荐

    ORACLE数据库物理分布设计.doc

    ORACLE数据库物理分布设计 概述 我们无论使用哪种数据库,无论怎样设计数据库,我想都会遵从一个原则:数据安全性 和性能高效这两个主要方面,但是关于这两个方面的话题太多,在这里就不一 一陈述,我只是从数据库...

    数据库物理设计经验谈

    我们无论使用哪种数据库,无论怎样设计数据库,我想都会遵从一个原则:数据安全性和性能高效这两个主要方面,但是关于这两个方面的话题太多,在这里就不一一陈述,我只是从数据库物理分布设计方面和大家一起简单的...

    数据库设计说明书模板

    数据库设计说明书 版本:V1.0 文 档 编 号 保 密 等 级 作 者 最后修改日期 审 核 人 最后审批日期 批 准 人 最后批准日期 修订记录 日期 版本 修订说明 修订人 目 ...

    数据库课程设计(图书管理系统).doc

    12 4.2.1分析并规范化现有的关系模式 12 4.2.2确定完整性约束 12 4.2.3用户视图的确定 13 第五章 物理设计 14 5.1 确定数据分布 14 5.2 确定数据存储结构 14 5.3 基本表设计 15 5.3.1餐台表 15 5.3.2菜系表 15 5.3.3...

    数据库设计方案.docx

    1、数据库逻辑上是由一个或多个表空间组成的,表空间物理上是由一个或多个数据文件组成的;而在逻辑上表空间又是由一个或多个段组成的。在数据库中,通过为每种不同的数据对象分配不同的段,来保存数据。在数据库中...

    浅谈数据库设计.doc

    物理结构设计需要确定数据分布、确定存储结构 、确定存取方式。 5.数据库实施阶段 确定了数据库的逻辑结构和物理结构以后,可以利用DBMS提供的数据定义语言建立数 据库的结构。 例如:CREATE TABLE 职工库。 (职工...

    数据库原理与应用课程设计教学大纲1

    介绍数据库的物理分布和存取方法等。西安石油大学本科课程教学大纲计算机学院分册(第7册)6. 数据表及其关系描述最终确定的数据库中的数据表以及各个表之间的关联关系

    数据库优化设计方案.doc

    优化自由结 构,简单地讲就是在数据库中可以高效自由地分布逻辑数据对象,因此首先要对数据库 中的逻辑对象根据他们的使用方式和物理结构对数据库的影响来进行分类,这种分类包 括将系统数据和用户数据分开、一般...

    关系数据库设计.doc

    目录 一 Codd的RDBMS12法则——RDBMS的起源 二 关系型数据库设计阶段 三 设计原则 四 命名规则 数据库设计,一个软件项目成功的基石。很多从业人员都认为,数据库设计其实不 那么重要。现实中的情景也相当雷同,开发...

    数据库架构设计.pdf

    数据库架构设计 author:skate time:2013/06/04 数据库架构设计 最近在考虑如何能设计好⼀个数据库架构,下⾯是个⼈⼀点想法,欢迎⾼⼈指正 任何系统都不是独⽴的,是⼀个⽣态系统,数据库也是⼀样的,要使其在其⽣...

    CH3 分布式数据库的设计

    在系统设计中,最基本问题就是分布式数据库的分布问题,即如何对分布式数据库进行逻辑划分和实际物理分配。数据的逻辑划分称数据分片。本章主要针对数据分布进行介绍,以关系数据库为例来说明。 两种设计策略( Top-...

    分布式数据库系统-复习.doc

    简答题 分布式数据库系统的特点是什么 答:物理分布性:数据不是存放在一个站点上 逻辑整体性:是与分散式数据库系统的区别 站点自治性:是与多处理机的系统的区别 数据分布透明性 集中与自治相结合 存在适当的数据...

    关系数据库设计(1).doc

    关系数据库设计(总8页) 目录 一 Codd的RDBMS12法则——RDBMS的起源 二 关系型数据库设计阶段 三 设计原则 四 命名规则 数据库设计,一个软件项目成功的基石。很多从业人员都认为,数据库设计其实不 那么重要。现实中...

    关系数据库设计(2).doc

    分布独立性 不管数据在物理是否分布式存储,或者任何时候改变分布策略,RDBMS的数 据操纵子语言必须能使应用程序和终端活动保持逻辑上的不变性。 非破坏性法则 如果一个关系数据库系统支持某种低级(一次处理单个...

    关系数据库设计(3).doc

    目录 一 Codd的RDBMS12法则——RDBMS的起源 二 关系型数据库设计阶段 三 设计原则 四 命名规则 数据库设计,一个软件项目成功的基石。很多从业人员都认为,数据库设计其实不 那么重要。现实中的情景也相当雷同,开发...

    数据库设计规范化.doc

    规范化 在设计和操作维护数据库时,关键的步骤就是要确保数据正确地分布到数据库的表中。 使用正确的数据结构,不仅便于对数据库进行相应的存取操作,而且可以极大地简化应 用程序的其他内容(查询、窗体、报表、...

    数据库课程设计--学生宿舍管理系统.doc

    R图 11 3.6.3、外部人员子系统说明 11 3.7、总体E-R图 12 3.7.1、E-R图的集成 12 3.7.2、总体E-R图 13 4、逻辑结构设计 14 4.1、关系数据模式 14 4.2、视图的设计 14 5、数据库物理设计与实施 15 5.1、数据库应用的...

    浅谈数据库系统优化.docx

    数据库的设计主要包含两个部分,一个是数据库存储分配的物理设计,一个是数据流量分配的逻辑设计。物理设计主要包括数据对象在物理介质上存储分布等各个方面,所要注意的问题就是在不同的存储介质上所放的数据块的...

    什么是数据库系统.doc

    数据库设计 这是在计算机系统具有的数据库管理系统的基础上,按照应用要求以及计算机系统所提 供的数据模型和功能,设计一个结构良好、使用方便、效率较高的,以数据库为核心的 应用信息系统。这一领域主要的研究...

    分布式数据库系统复习题.doc

     一个分布式数据库 系统具有如下特点: 物理分布性,即分布式数据库系统中的数据不是存储在一个站点上,而是分散存 储在由计算机网络连接起来的多个站点上,而且这种分散存储对用户来说是感觉 不到的。 逻辑整体性...

Global site tag (gtag.js) - Google Analytics