首页 / 数据库 / MySQL / Oracle 10g RAC 节点自动重启故障处理
将数据库集群升级到10.2.0.5之后,双节点服务器不断重启,查询Oracle oprocd进程日志,信息如下:Jul 03 08:16:34.702 | INF | monitoring started with timeout(1000), margin(500), skewTimeout(125)
Jul 03 08:16:34.704 | INF | fatal mode startup, setting process to fatal mode可以看到看到oprocd进程的时间间隔设置为timeout(1000), margin(500), skewTimeout(125)查看其它的日志信息,没有发现明显的错误信息,因此怀疑是oprocd的时间参数设置不当。
修改参数如下:#crsctl set css diagwait 13 -force修改参数时,需要注意如下几个事项
当我们设置diagwait参数时,需要停止所有rac节点的集群活动,停止顺序如下(如果集群式活动的,修改diagwait有可能会损害ocr):
1,以root用户在所有节点执行#crsctl stop crs
#<CRS_HOME>/bin/oprocd stop2,确认所有节点的进程已经停止#ps -ef |egrep "crsd.bin|ocssd.bin|evmd.bin|oprocd"3,修改参数,仅仅在一个节点修改就可以了#crsctl set css diagwait 13 -force4,查看参数修改情况#crsctl get css diagwait5,启动集群节点#crsctl start crs
#crsctl check crs修改参数后,集群服务运行正常,没有再自动重启过。--------------------------------------------------------------------------------Linux-6-64下安装Oracle 12C笔记 http://www.linuxidc.com/Linux/2013-07/86805.htm在CentOS 6.4下安装Oracle 11gR2(x64) http://www.linuxidc.com/Linux/2014-02/97374.htmOracle 11gR2 在VMWare虚拟机中安装步骤 http://www.linuxidc.com/Linux/2013-09/89579p2.htmDebian 下 安装 Oracle 11g XE R2 http://www.linuxidc.com/Linux/2014-03/98881.htm--------------------------------------------------------------------------------更多Oracle相关信息见Oracle 专题页面 http://www.linuxidc.com/topicnews.aspx?tid=12本文永久更新链接地址