本文出自头条号老王谈运维,转载请说明出处。

前言

对于线上的业务,Oracle 的数据库运行的稳定性和安全性是用户关心的一个至关重要的问题,除了通过监控平台对数据库进行监控以外,还需要定期对数据库进行“体检”,数据库巡检是保障数据库稳定运行的必不可少的辅助手段。

oracle数据库运维规范 高效进行Oracle日常巡检(1)

oracle数据库运维规范 高效进行Oracle日常巡检(2)

本文将简要介绍一下从哪些方面对 Oracle 数据库进行巡检以及巡检的方法。

检查数据库的基本状况

1.1 检查 Oracle 实例状态

SQL> select instance_name,host_name,startup_time,status,database_status from v$instance;

oracle数据库运维规范 高效进行Oracle日常巡检(3)

其中“STATUS”表示Oracle当前的实例状态,必须为“OPEN”;“DATABASE_STATUS”表示Oracle当前数据库的状态,必须为“ACTIVE”。

SQL> select name,log_mode,open_mode from v$database;

oracle数据库运维规范 高效进行Oracle日常巡检(4)

其中

  • “LOG_MODE”表示Oracle当前的归档方式;
  • “ARCHIVELOG”表示数据库运行在归档模式下;
  • “NOARCHIVELOG”表示数据库运行在非归档模式下。

在我们的系统中数据库必须运行在归档方式下。

1.2 检查 Oracle 服务进程

$ps -ef|grep ora_|grep -v grep&&ps -ef|grep ora_|grep -v grep|wc –l

oracle数据库运维规范 高效进行Oracle日常巡检(5)

在检查Oracle的进程命令输出后,输出显示至少应包括以下一些进程:

  • Oracle写数据文件的进程,输出显示为:“oradbw0CKDB”
  • Oracle写日志文件的进程,输出显示为:“oralgwr CKDB”
  • Oracle监听实例状态的进程,输出显示为:“orasmon CKDB” .
  • Oracle监听客户端连接进程状态的进程,输出显示为:“orapmon CKDB”
  • Oracle进行归档的进程,输出显示为:“oraarc0 CKDB”
  • Oracle进行检查点的进程,输出显示为:“orackptCKDB” .
  • Oracle进行恢复的进程,输出显示为:“orareco CKDB”

1.3 检查 Oracle 的监听状态

lsnrctl status

oracle数据库运维规范 高效进行Oracle日常巡检(6)

“Services Summary”项表示Oracle的监听进程正在监听哪些数据库实例。

检查监听进程是否存在:

ps -ef|grep lsn|grep -v grep oracle 2954 1 0 May07 ? 00:01:17 /data/oracle/product/11.2.0/bin/tnslsnr LISTENER –inherit

检查系统和 Oracle 日志文件

检查相关的日志文件主要包含:

  • 检查操作系统的日志文件
  • 检查Oracle日志文件
  • 检查Oracle核心转储目录
  • 检查Root用户和Oracle用户的email

总共四个部分。

2.1 检查操作系统日志文件

# cat /var/log/messages |grep failed

查看是否有与Oracle用户相关的出错信息。

2.2 检查 Oracle 日志文件

$ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep ora- $ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep err $ cat /data/oracle/admin/CKDB/bdump/alert_CKDB.log |grep fail

在Oracle的运行中,会在警告日志文件中记录数据库的一些运行情况 ,定时查看此文件,可以及时了解数据库运行状态是否异常。

2.3 检查 Oracle 核心转储目录

$ls $ORACLE_BASE/admin/CKDB/cdump/*.trc|wc -l $ls $ORACLE_BASE/admin/CKDB/udump/*.trc|wc –l

如果上面命令的结果每天都在增长,则说明Oracle进程经常发生核心转储。这说明某些用户进程或者数据库后台进程由于无法处理的原因而异常退出。频繁的核心转储特别是数据库后台进程的核心转储会导致数据库异常终止。

2.4 检查Root用户和Oracle用户的email

#tail –n 200 /var/mail/root #tail –n 200 /var/mail/oracle

查看有无与Oracle用户相关的出错信息。

检查oracle对象状态

主要检查相关Oracle对象的状态,包含:

  • 检查Oracle控制文件状态
  • 检查Oracle在线日志状态
  • 检查Oracle表空间的状态
  • 检查Oracle所有数据文件状态
  • 检查Oracle所有表、索引、存储过程、触发器、包等对象的状态
  • 检查Oracle所有回滚段的状态

总共六个部分。

3.1 检查控制文件状态

SQL> select status,name from v$controlfile;

oracle数据库运维规范 高效进行Oracle日常巡检(7)

输出结果“STATUS”应该为空。状态为空表示控制文件状态正常。

3.2 检查在线日志文件状态

SQL>select group#,status,type,member from v$logfile;

oracle数据库运维规范 高效进行Oracle日常巡检(8)

输出结果“STATUS”应该为非“INVALID”,非“DELETED”。

注:“STATUS”显示为空表示正常。

3.3 检查表空间的状态

SQL> select tablespace_name,status from dba_tablespaces;

oracle数据库运维规范 高效进行Oracle日常巡检(9)

输出结果中STATUS应该都为ONLINE。

3.4 检查所有数据文件状态

SQL> select name,status from v$datafile;

oracle数据库运维规范 高效进行Oracle日常巡检(10)

输出结果中“STATUS”应该都为“ONLINE”或者为“AVAILABLE”

3.5 检查无效的对象

sql>select owner,object_name,object_type from dba_objects where status!='VALID' and owner!='SYS' and owner!='SYSTEM'; no rows selected

如果有记录返回,则说明存在无效对象。若这些对象与应用相关,那么需要重新编译生成这个对象。


网站崩溃找不到原因?平台搭建无从下手?热门技术不想落伍?想要变强找不到资料?

加入[IT拯救联盟],让大牛和同伴拯救你,带你装x带你飞。定期干货分享、大牛专业解答、实用IT工具优选.....

私信小编“联盟”,即可加入我们~

,