Ontape -r 恢复大总结 - Unix爱好者家园

昵称90415 2009-02-24

展开全文

Ontape -r 恢复大总结

作者：lianyong 出处：Unix爱好者家园unix-cd.com 更新时间： 2004年07月22日

以下是我做ontape -r 的总结，我只是将自己的经验共享出来(因为我看到论坛里虽然有这方面的帖子，但都不是很详细)
因为整个过程只是在我能接触的特有的环境中完成，所以如有错误之处欢迎大家指正。。。

主要分六个部分
1.恢复的前提 2.详细恢复过程 3.对恢复期间的监视
4.恢复成功整个过程的online.log
5.恢复过程中我曾遇到的问题
6.常用到的命令

一、恢复的前提(从多次恢复过程可以总结如下：)
我用ontape备份的数据恢复到另一台服务器上时，环境如下
1.两台服务器机型一样(HPL2000系列）
2.操作系统一样(HP-UX B.11.00)、数据库版本一样(IDS7.31.FC6)、
3.非临时分配的Dbspace磁盘空间数量和大小必须一致(即你的各个dbspace对应的chunk大小一样，所对应的符号联接
所在目录的位置最好也保证一样）
4.Onconfig配置文件(最后提出来！它并不要求完全一样！！！)
就以我恢复的机器来说，它和做0级备份的生产机虽然都是hp小型机，但cpu个数，内存，硬盘个数
都不一样，故onconfig相应的参数例如NETTYPE、NUMCPUVPS 都不一样，但我保证了如下参数在onconfig中的一致：
ROOTNAME
ROOTPATH
ROOTOFFSET
ROOTSIZE

MIRROR
MIRRORPATH
MIRROROFFSET

TAPEDEV
TAPEBLK
TAPESIZE

LTAPEDEV
LTAPEBLK
LTAPESIZE

LOGSMAX

其它的都没变化了，反正我这样做是成功了。。。）

注意的问题：
在恢复过程中，如果恢复失败，则可能恢复机上的数据库oninit起不来，则只好用oninit -i来初始化了--（（（，
我没找到好的方法。。。
--------------------------------------------------------------------------------
---------------------------------------------------------------------------------
二、详细恢复过程：(只做0级恢复)
1。切换成informix用户，(这一步根据实际情况选做)
ps -ef |grep isql ,如有此进程，kill掉
2.用ipcs 查看还有无其它数据库用户占用的共享内存
确认后以上后(如上述共享内存还存在，则可能会在ontape -r过程中会报 “共享内存初始化失败”，而导致恢复失败！！！)
3.onmode -ky 下掉数据库
hp9000:/informix/etc>ontape -r

Please mount tape 1 on /dev/rmt/0m and press Return to continue ...

Archive Tape Information
Tape type: Archive Backup Tape
Online version: Informix Dynamic Server Version 7.31.FC6
Archive date: Wed Dec 3 16:50:54 2003
User id: hcb
Terminal id: /dev/pts/10
Archive level: 0
Tape device: /dev/rmt/0m
Tape blocksize (in k): 4096
Tape size (in k): 25165824
Tape number in series: 1

。。。。。。。。。。。。。。。
这里显示的是备份的磁盘配置(可验证是否生成了正确的设备和连接)。包括dbspace和chunk等情况。省略了。。。

1。Continue restore? (y/n)y
2。Do you want to back up the logs? (y/n)n
------------------------------------ 进入FastRecovery状态（onstat -观察）
/*此时间开始进行恢复，时间较长，且没有完成百分比提示，请耐心等待*/

3。Restore a level 1 archive (y/n) n
--------------------------------------- 此步应回答为n,不需要进行1级恢复
4。Do you want to restore log tapes? (y/n)n
------------------------------------------ 此步应回答为n,不需要进行日志恢复

Program over. /*恢复完成*/

/home/informix/bin/onmode -sy /*数据库自动进入quiescent 模式*/

/*此期间会存在一个fast recovery模式，直至进入quiescent 模式。可用onstat -、onstat -d监测数据库的情况。*/

5。如onstat - 显示已经进入quiescent模式，则手工执行:
onmode -m /*使数据库online*/

6。完成。（整个过程为3小时20分钟,24G磁带）

--------------------------------------------------------------------------------------
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
三、对恢复期间的监视
在恢复DBSPACE期间，由于online.log不更新(我也不知道为什么，是有问题？反正tail -f online.log没有变化)，
所以监视恢复状况我就采用onstat来分析

hp9000:/informix>onstat -d （可观察基本的dbspace情况）

Informix Dynamic Server Version 7.31.FC6 -- Fast Recovery (CKPT REQ) -- Up 00:59:30 -- 316616 Kbytes
Blocked:CKPT

hp9000:/informix>onstat -u（查看磁带读写速度）

Informix Dynamic Server Version 7.31.FC6 -- Fast Recovery (CKPT REQ) -- Up 01:30:48 -- 316616 Kbytes
Blocked:CKPT

Userthreads
address flags sessid user tty wait tout locks nreads nwrites
c000000011053028 ---P--D 1 informix - 0 0 0 11 3
c0000000110536f0 ---P--F 0 informix - 0 0 0 0 0
c000000011053db8 ---P--F 0 informix - 0 0 0 0 0
c000000011054480 ---P--F 0 informix - 0 0 0 0 0
c000000011054b48 Y--P--M 13 informix to c0000000114898e0 0 0 0 0
c000000011055210 ---P--- 14 informix - 0 0 0 0 0
c0000000110558d8 ---P--B 15 informix - 0 0 0 0 0
c000000011055fa0 ---P--D 16 informix - 0 0 0 0 0
c000000011056668 -----R- 13 informix to 0 0 0 5 4543006
9 active, 128 total, 9 maximum concurrent
5046814
5857822
6066718 Mon Dec 15 22:21:56 EAT 2003
6498846 Mon Dec 15 22:30:15 EAT 2003
7029278 Mon Dec 15 22:40:37 EAT 2003
8221214 Mon Dec 15 23:02:08 EAT 2003
10506782 Mon Dec 15 23:44:14 EAT 2003
主要看nwrites那一列的数据变化,应该是按时间不断增大。。。

hp9000:/informix>sar -d 2 20
查看磁盘读写状态，通过逻辑卷管理的硬盘，例如对c0t9d0（我的机器正是将dbspace对应的裸设备建在此硬盘组成的逻辑卷上）
的读写可监视恢复是否正常进行。。。

--------------------------------------------------------------------------------------------------------

四、恢复成功整个过程的online.log
-----------------------------------------------------------------------------------------------------------------------------
20:22:54 Dynamically allocated new virtual shared memory segment (size 8192KB)

20:22:54 Dynamically allocated new virtual shared memory segment (size 8192KB)

20:22:54 Physical Restore of rootdbs, hcbdbs, logdbs started.

20:23:03 Checkpoint Completed: duration was 0 seconds.
/*在恢复DBSPACE过程中无日志！？*/

23:49:40 Checkpoint Completed: duration was 0 seconds.
23:49:41 Checkpoint Completed: duration was 0 seconds.
23:49:41 Physical Restore of rootdbs, hcbdbs, logdbs Completed.
23:49:41 Checkpoint Completed: duration was 0 seconds.
23:52:13 Physical Recovery Started.
23:52:13 Physical Recovery Complete: 0 Pages Restored.
23:52:13 Logical Recovery Started.
23:52:16 Logical Recovery Complete.
0 Committed, 0 Rolled Back, 0 Open, 0 Bad Locks

23:52:16 Bringing system to Quiescent Mode with no Logical Restore.

23:52:17 Quiescent Mode
23:52:17 Checkpoint Completed: duration was 0 seconds.
23:53:22 On-Line Mode
23:53:22 Affinitied VP 3 to phys proc 1
23:53:22 Affinitied VP 1 to phys proc 0
23:57:26 Checkpoint Completed: duration was 1 seconds.
------------------------------------------------------------------------------------------------------------------------
----------------------------------------------------------------------------------------------------------------------
五、恢复过程中我曾遇到的问题：
0。恢复过程失败，online.log里提示“共享内存初始话失败”
可能恢复前虽然数据库已下掉，但共享内存还有相关未清除掉的东东，ipcs看看，然后杀掉
1。提示原dbspace和chunk和恢复机上的不一致，
这时要根据备份带上给的dbspace情况新建chunk对应的裸设备和符号连接
2。恢复过程出现以下错误：

Continue restore? (y/n)y
Do you want to back up the logs? (y/n)n
Unable to open input file 's'
Unable to open input file 'c'
Physical restore failed - buc_fe.c : Archive API processing failed at line 703 for msgtype
Program over.
处理：
请先检查dbspace对应裸设备文件及符号连接和所在目录的权限和属性，保证正确！！！
如没有问题，
Do the following commands as root:

# vi /etc/privgroup and add the following line
informix MLOCK
# getprivgrp
global privileges: CHOWN
# setprivgrp -f /etc/privgroup
# getprivgrp
global privileges: CHOWN
informix: MLOCK

然后再做恢复。。。
----------------------------------------------------------------------------------------------------------
六、常用到的命令

oninit
oninit -iy （初始化数据库，删除所有dbspace和chunk）
oninit -s （脱机-->静态）

onmode -ky offline
onmode -s graceful shutdown-->quiescent（联机到静态，让用户处理完成）
onmode -u immediate shutdown-->quiescent（联机到静态，所有用户立即终止）
onmode -m quiescent--->online

onstat - 查看服务器状态
onstat -d 查看dbspace和chunk情况
onstat -l 查看逻辑日志

ipcs 查看共享内存情况
ipcrm 删除某个共享内存
ipcrm -m id
ipcrm -s id

有关逻辑日志的操作
以informix用户登录，

$ onmode -uy (由Online切换到Quiescent状态,所有用户立即中止)
onmode -m (切换到Online)

$ onparams -a -d logdbs -s 100000 (在logdbs中增加逻辑日志)

其中logdbs为dbspaces 名，-s 100000 表示增加了100M空间。

　　再连续执行4遍上述命令，这样新的逻辑日志空间总共为500M,可以用
onstat -l 查看逻辑日志情况，接下来就要删除前面3个旧逻辑日志，
删除前做一个0级备份

# ontape -s -L 0
执行该命令做0级备份，建议: 如果允许可以每天在业务系统结束工作
后做一次0级备份，做完备份后管理好备份磁带，做好标记。

$ onparams -d -l logid

logid 为逻辑日志id号，可以用onstat -l 查看，然后就可根据id号删
除3个旧逻辑日志。

1.增加一个新的dbspace:（datadbs,15M, 偏移为0）
onspaces -c -d datadbs -p /home/informix/datadbs -o 0 -s 15000
2.在datadbs这一个dbspace中增加一个chunk:(datadbs_chunk1)
onspaces -a datadbs -p /home/informix/datadbs_chunk1 -o 0 -s 15000
3.将上述chunk删除
onspaces -d datadbs -p /home/informix/datadbs_chunk1 -o 0
4.删除dbspace（仅当要删除的dbspace空间没有数据时才可删除）
onspace -d datadbs

导出数据库：
用dbexport工具将数据卸成文本，并装载到其它服务器上。
（1）卸载文本的步骤如下：
用informix用户注册
dbexport cleardb -o WORKDIR -ss
当系统提示dbexport completed！数据卸载完毕。
其中：
-ss 确保数据库的建库信息或建表信息被保留如日志模式、初始extent尺寸、lock mode、表所在dbspace等。
-o 指定存放卸载数据的目录数据存放在目录cleardb.exp目录下，其中包含cleardb.sql和形如*.unl的文件，
提示信息存放在dbexport.out文件中。
（2）装载文本的步骤如下：
用informix用户注册确保数据库处于On_Line状态，服务器上没有同名数据库。
dbimport cleardb -i WORKDIR
当系统dbimport completed！提示数据装载完毕。
其中:
-i 指定从何处装载。

如何在不破坏库本身信息情况下（如行级锁等）将数据库卸载到磁带设备，并装载在其它服务器上？
1）卸载的步骤如下：
用DBA用户注册
将存放数据的磁带插入磁带机，确认磁带及磁带机完好可用。
dbexport cleardb -t /dev/rmt/0m -b 512k -s 2048000k -ss
当系统提示dbexport completed！数据卸载完毕。
其中：
-ss 确保数据库的建库信息或建表信息被保留如日志模式，初始extent尺寸，lockmode，表所在dbspace
-t 磁带设备/dev/rmt/0m
-s 磁带容量2G
-b 块大小512KB
提示信息存放在dbexport.out文件中
2）装载的步骤如下：
用DBA用户注册
将存放卸载数据的磁带放在磁带机上，确认磁带机正常，确认数据库系统处于On_Line状态，服务器上没有同名数据库。
$ dbimport cleardb -t /dev/rmt/0m -b 512k -s 2048000k
当系统dbimport completed 提示数据装载完毕！提示信息存放在dbimport.out 文件中。