SQL> conn /as sysdba Connected to an idle instance. SQL> startup oracle instance started. Total System Global Area 276824064 bytes Fixed Size 778736 bytes Variable Size 137371152 bytes Database Buffers 138412032 bytes Redo Buffers 262144 bytes ORA-01102: cannot mount database in EXCLUSIVE mode
出现这个问题,可能是由于断电的问题,解决方法是
出现1102错误可能有以下几种可能:
一、在HA系统中,已经有其他节点启动了实例,将双机共享的资源(如磁盘阵列上的裸设备)占用了;
二、说明 oracle 被异常关闭时,有资源没有被释放,一般有以下几种可能,
1、 oracle 的共享内存段或信号量没有被释放;
2、 oracle 的后台进程(如SMON、PMON、DBWn等)没有被关闭;
3、 用于锁内存的文件lk
首先,虽然我们的系统是HA系统,但是备节点的实例始终处在关闭状态,这点通过在备节点上查数据库状态可以证实。
其次、是因系统掉电引起数据库宕机的,系统在接电后被重启,因此我们排除了第二种可能种的1、2点。最可疑的就是第3点了。
查$ORACLE_HOME/dbs目录:
$ cd $ORACLE_HOME/dbs $ ls sgadef* sgadef* not found $ ls lk* lkORA92
果然,lk
$ rm lk*
再启动数据库,成功。
如果怀疑是共享内存没有被释放,可以用以下命令查看:
$ipcs -mop IPC status from /dev/kmem as of Thu Jul 6 14:41:43 2006 T ID KEY MODE OWNER GROUP NATTCH CPID LPID Shared Memory: m 0 0×411c29d6 –rw-rw-rw- root root 0 899 899 m 1 0×4e0c0002 –rw-rw-rw- root root 2 899 901 m 2 0×4120007a –rw-rw-rw- root root 2 899 901 m 458755 0×0c6629c9 –rw-r—– root sys 2 9113 17065 m 4 0×06347849 –rw-rw-rw- root root 1 1661 9150 m 65541 0xffffffff –rw-r–r– root root 0 1659 1659 m 524294 0×5e100011 –rw——- root root 1 1811 1811 m 851975 0×5fe48aa4 –rw-r—– oracle oinstall 66 2017 25076
然后它ID号清除共享内存段:
$ipcrm –m 851975
对于信号量,可以用以下命令查看:
$ ipcs -sop IPC status from /dev/kmem as of Thu Jul 6 14:44:16 2006 T ID KEY MODE OWNER GROUP Semaphores: s 0 0×4f1c0139 –ra——- root root … … s 14 0×6c200ad8 –ra-ra-ra- root root s 15 0×6d200ad8 –ra-ra-ra- root root s 16 0×6f200ad8 –ra-ra-ra- root root s 17 0xffffffff –ra-r–r– root root s 18 0×410c05c7 –ra-ra-ra- root root s 19 0×00446f6e –ra-r–r– root root s 20 0×00446f6d –ra-r–r– root root s 21 0×00000001 –ra-ra-ra- root root s 45078 0×67e72b58 –ra-r—– oracle oinstall
根据信号量ID,用以下命令清除信号量:
$ipcrm -s 45078
如果是 oracle 进程没有关闭,用以下命令查出存在的 oracle 进程:
$ ps -ef|grep ora oracle 29976 1 0 Jun 22 ? 0:52 ora_dbw0_ora92 oracle 29978 1 0 Jun 22 ? 0:51 ora_dbw1_ora92 oracle 5128 1 0 Jul 5 ? 0:00 oracleora92 (LOCAL=NO) … …
然后用kill -9命令杀掉进程
$kill -9
总结:
当发生1102错误时,可以按照以下流程检查、排错:
1.如果是HA系统,检查其他节点是否已经启动实例;
2.检查 oracle 进程是否存在,如果存在则杀掉进程;
3.检查信号量是否存在,如果存在,则清除信号量;
4.检查共享内存段是否存在,如果存在,则清除共享内存段;
5.检查锁内存文件lk