`
itspace
  • 浏览: 963697 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

记一次Oracle rac vip启动错误处理

阅读更多
这几天出差在外,由于考试将近,在出差途中,也不忘学习啊,悲剧。由于本机上缺少一套rac环境,所以打算在虚拟机上安装Oracle rac 10g,基础环境为linux as3+Oracle 10.2.0.1。公有网卡和私有网卡采用host only模式。本人在虚拟机上安装rac 10g起码不下5次了,考虑到虚拟机的不稳定性,每次安装都不是很顺利,磕磕碰碰,但每次都基本上在1天之内能完成的,但这一次比较郁闷,花的时间比较长,所以值得注意的地方也比较多(以前由于比较顺利,很多地方忽视了)。如需要注意防火墙关闭,主机和宿机之间的时间同步,共享存储的划分,虚拟机参数的设置,虚拟机之间的网关设置,软件包的安装等等。其中有三个地方需要我们尤其注意,
1、软件包的安装,强烈建议将develop tool全装上,如果你时间多,可以一个一个包慢慢安装!
2、虚拟机参数的设置,为了让同行们少走弯路,虚拟机参数应设置为(注意虚拟机版本为
引用
vmware server 2.0)
disk.locking = "FALSE"
diskLib.dataCacheMaxSize = "0"
diskLib.dataCacheMaxReadAheadSize = "0"
diskLib.dataCacheMinReadAheadSize = "0"
diskLib.dataCachePageSize = "4096"
diskLib.maxUnsyncedWrites = "0"
scsi1.present = "TRUE"
scsi1.virtualDev = "lsilogic"
scsi1.sharedBus = "VIRTUAL"

我正是因为参数设置不准确,碰到了很多稀奇古怪的问题,如asm磁盘组不能同时挂载,或者一节点挂载之后,磁盘头损坏等,为了这个问题几乎折腾了一整天,往事不堪回首!因为我当初只设置了如下三个参数:
引用
disk.locking = "FALSE"
diskLib.dataCacheMaxSize = "0"
scsi1.sharedBus = "VIRTUAL"

3、虚拟机共享磁盘最好需分配好大小,这是经验之谈,虽然找不到什么理论根据,但是实践表明预分配好的磁盘出现坏块的几率大大减小,很多莫名其妙的问题就是坏块引起的。但是预分配好磁盘可能会在一开始占用空间。
4、虚拟机不要设置网关,这个问题困扰了很久,也将近耗时1天,之前我设置了和公有网卡同一网段的网关,设置好,安装crs之后,古怪的事情发生了:
a、节点间vip经常莫名掉线
b、vip地址经常跑错节点,即1节点启动2节点的vip,但是1节点不能启动自身vip地址
c、vip地址不能被nodeapp带动
这三个怪现象困扰了我好久,期间尝试了crs重装升级,网卡从hostonly模式转成bridge模式,更换网关,但是故障依旧。crsd.log错误日志也仅仅显示
引用
2011-06-24 13:33:51.682: [  CRSRES][570047408]0Attempting to start `ora.racsvr1.vip` on member `racsvr1`
2011-06-24 13:34:04.374: [  CRSAPP][570047408]0StartResource error for ora.racsvr1.vip error code = 1
2011-06-24 13:34:07.884: [  CRSRES][570047408]0Start of `ora.racsvr1.vip` on member `racsvr1` failed.

使劲浑身解数,问题还得不到解决,比较郁闷,此时突然想起,单独尝试启动vip,错误不一样了

引用
[oracle@racsvr1 oracle]$ crs_start ora.racsvr1.vip
Attempting to start `ora.racsvr1.vip` on member `racsvr1`
Start of `ora.racsvr1.vip` on member `racsvr1` failed.
CRS-1006: No more members to consider

CRS-0215: Could not start resource 'ora.racsvr1.vip'.


马上查metalink,根据 metalink 文档 CRS-0215: Could not start resource 'ora..vip' [ID 356535.1]
修改$ORA_CRS_HOME/bin/racgvip将参数FAIL_WHEN_DEFAULTGW_NOT_FOUND=0,此参数的意思vip启动时检查默认网关不存在时不进行报错。
设置好参数之后,继续尝试启动,这次采用nodeapp带动vip,继续报错。这次报错和metalink 文档Bug 5076555: VIP CRASHING FAIL_WHEN_DEFAULTGW_NOT_FOUND=0 SEEMS TO BE IGNORED很类似,但是没有解决方案。这里需要鄙视一下Oracle,Oracle既然已经将其归为bug了,竟然无动于衷,解决方案也不给一个。
引用
[oracle@racsvr1 oracle]$ srvctl start nodeapps -n racsvr1
racsvr1:ora.racsvr1.vip:ping to 10.20.30.99 via eth0 failed, rc = 1 (host=racsvr1)
racsvr1:ora.racsvr1.vip:ping to 10.20.30.99 via eth0 failed, rc = 1 (host=racsvr1)
racsvr1:ora.racsvr1.vip:Interface eth0 checked failed (host=racsvr1)
racsvr1:ora.racsvr1.vip:Invalid parameters, or failed to bring up VIP (host=racsvr1)
CRS-1006: No more members to consider
CRS-0215: Could not start resource 'ora.racsvr1.vip'.
racsvr1:ora.racsvr1.vip:ping to 10.20.30.99 via eth0 failed, rc = 1 (host=racsvr1)
racsvr1:ora.racsvr1.vip:ping to 10.20.30.99 via eth0 failed, rc = 1 (host=racsvr1)
racsvr1:ora.racsvr1.vip:Interface eth0 checked failed (host=racsvr1)
racsvr1:ora.racsvr1.vip:Invalid parameters, or failed to bring up VIP (host=racsvr1)
CRS-1006: No more members to consider
CRS-0215: Could not start resource 'ora.racsvr1.LISTENER_RACSVR1.lsnr'.

其实上面提示已经很明确,ping to 10.20.30.99 via eth0 failed,但是我们ping网关完全没问题
引用
[oracle@racsvr1 oracle]$ ping 10.20.30.99
PING 10.20.30.99 (10.20.30.99) 56(84) bytes of data.
64 bytes from 10.20.30.99: icmp_seq=0 ttl=64 time=0.028 ms
64 bytes from 10.20.30.99: icmp_seq=1 ttl=64 time=0.028 ms
64 bytes from 10.20.30.99: icmp_seq=2 ttl=64 time=0.028 ms
64 bytes from 10.20.30.99: icmp_seq=3 ttl=64 time=0.026 ms

--- 10.20.30.99 ping statistics ---
4 packets transmitted, 4 received, 0% packet loss, time 3032ms
rtt min/avg/max/mdev = 0.026/0.027/0.028/0.005 ms, pipe 2

此时解决又一陷入僵局,FAIL_WHEN_DEFAULTGW_NOT_FOUND参数不起作用!根据此参数的说明
引用
# set it to 0 for checkIf() to return success if default gateway is not found,

似乎此参数仅仅在网关不存在时才生效?于是马上删除网关:
引用
[oracle@racsvr1 oracle]$ su -
Password:
[root@racsvr1 root]#  route delete default gw 10.20.30.99

为了启动生效,将配置文件也同时注释掉网关内容
引用
#cat /etc/sysconfig/network
NETWORKING=yes
HOSTNAME=racsvr1
#GATEWAY=10.20.30.99

再次启动vip时,终于启动成功了!鼓掌!!!
引用
[oracle@racsvr1 oracle]$ crs_start ora.racsvr1.vip
Attempting to start `ora.racsvr1.vip` on member `racsvr1`
Start of `ora.racsvr1.vip` on member `racsvr1` succeeded.


以上问题,可能在实体机上不会碰到,也可能我对vmware掌握不精(本来就不精),反正终于解决了!!!记录一下安装时间(6.22 16:00-6.24:14:30),以作留念!
分享到:
评论

相关推荐

    记录一次在Vmware ESXi6虚拟机环境下搭建oracle的RAC的过程

    在本文中,我们将记录一次在Vmware ESXi6虚拟机环境下搭建Oracle RAC的过程。Oracle RAC(Real Application Clusters)是一种高可用性解决方案,能够提供高性能和高可用性数据库服务。在本文中,我们将详细介绍搭建...

    Oracle RAC重启操作手册

    这个文档详细的记录了重启Oracle rac的每一个步骤,重启的方法很多,这个可能不是最适合你的,但这个是有效的,这个文档是我给外行看的

    oracle rac防火墙配置学习

    Linux 常用命令 oracle rac 中文手册 官网翻译 oracle rac

    Oracle RAC增加ASM盘,创建表空间

    Oracle RAC 是一种高可用、高性能的数据库解决方案,通过将多个服务器节点组成一个集群,提供了高可用性和高性能的数据库服务。在 Oracle RAC 中,ASM(Automated Storage Management)是一种存储管理技术,用于管理...

    Oracle RAC 12c运维最佳实践指南.pdf

    Oracle RAC 12c 是一种高可用、高性能的集群解决方案,旨在实现数据库的高可用性和可扩展性。本文将对 Oracle RAC 12c 运维最佳实践指南进行解读,总结出相关的知识点。 一、 Oracle RAC 12c 概述 Oracle RAC 12c ...

    oracle rac (veritas)双机集群,机器主板挂掉后的单节点启动

    oracle rac (veritas)双机集群,一套机器挂了没发现,等两套都挂了才发现都是主板坏。。。

    深入理解OracleRAC12c

    资源名称:深入理解Oracle RAC 12c内容简介:《深入理解Oracle RAC 12c》介绍了Oracle RAC 12c技术的方方面面,涵盖了与RAC技术相关的集群件知识、数据库知识、存储知识、网络知识,并在基于RAC的应用软件设计、优化...

    oracle rac 安装部署文档.pdf

    Oracle RAC 安装部署文档 本文档详细介绍了 Oracle RAC 的安装部署过程,涵盖了物理硬件配置需求、虚拟机需求、操作系统安装、数据库安装、 Oracle RAC 图形界面搭建方法、创建磁盘组、安装 Oracle 数据库、性能...

    oracle rac 不停机调整时间.txt

    oracle rac 不停机调整时间.txt

    Oracle rac功能测试方案

    此文档是Oracle 11g rac安装完成后的IOPS、负载均衡、TAF等的测试,内容详尽。

    oracle rac安装个人笔记

    oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记oracle rac安装个人笔记...

    Oracle RAC数据库环境安装配置手册 For RHEL

    Oracle RAC(Real Application Clusters)是一种高可用性的数据库解决方案,能提供高性能和高可用性数据库服务。 Oracle RAC环境的安装配置是整个解决方案的关键步骤,本手册将指导用户如何在 RHEL(Red Hat ...

    Oracle RAC Cache Fusion介绍.pdf

    Oracle RAC Cache Fusion 是一种高效的缓存机制,在 Oracle Real Application Clusters (RAC) 环境中, 实现多个节点对数据的并发访问和修改。Cache Fusion 的要点包括高速私有网络、共享存储和节点间的访问机制。 ...

    Centos7安装部署Oracle RAC 11G

    Centos7安装部署Oracle RAC 11G说明文档,Oracle 11g R2安装,RAC环境搭建

    在Oracle 11g,RAC的关闭和启动顺序如下【20180625】 

    ★在Oracle 11g,RAC的关闭和启动顺序如下【20180625】

    Oracle RAC Failover 详解

    Oracle RAC Failover 详解

    Oracle-RAC日常管理和维护.doc

    Oracle RAC(Real Application Clusters)是一种高可用、高性能的集群解决方案,旨在提供高级别的可用性、可伸缩性和低成本计算能力。以下是 Oracle RAC 日常管理和维护的重要知识点: 1. Oracle RAC 简介 Oracle ...

    ORACLE 19C RAC 搭建部署(全网最详细)

    Oracle 19C RAC 搭建部署是数据库管理系统中的一种高可用性解决方案,能够提供高性能和高可用性的数据库服务。下面将对 Oracle 19C RAC 搭建部署的详细信息进行说明和分析。 1. 硬件描述 在搭建 Oracle 19C RAC 时...

    Oracle RAC部署环境准备手册之一:系统与工具安装

    Oracle RAC 操作系统安装 oracle RAC部署环境

Global site tag (gtag.js) - Google Analytics