数据库 2023-07-14

探析Oracle数据库启动的原理与机制 (oracle数据库启动原理)

导言：

Oracle数据库是企业级的数据库软件，应用范围非常广泛，并且具有高可靠性、高安全性等特点。但是，对于Oracle数据库启动的原理和机制，需要深入研究和分析才能全面了解。

一、Oracle数据库启动前的准备工作

在Oracle数据库启动前，需要对操作系统和Oracle环境进行一些配置工作。操作系统需要安装Oracle软件和设置环境变量，Oracle环境需要进行数据库实例的创建和参数的配置。

二、Oracle数据库启动的步骤

1. 初始化参数文件

在Oracle数据库启动时，需要读取初始化参数文件来获取数据库的基本信息和配置参数。如果系统没有指定参数文件，则会使用默认的参数文件进行启动。参数文件主要包括数据库的名称、端口号、内存大小、存储路径等。

2. 创建进程和线程

Oracle数据库启动时，会创建多个进程和线程，包括后台进程、用户进程、监听进程等。后台进程主要负责数据库的管理和维护，用户进程则是客户端连接到数据库时创建的线程，监听进程则负责接受客户端连接请求、传递请求到相应的进程中处理。

3. 初始化SGA

SGA（System Global Area）是Oracle数据库中的共享内存区域，其中存储了大量数据库缓存信息和系统状态信息。在Oracle数据库启动时，需要初始化SGA，包括分配内存、初始化缓存结构等操作。

4. 启动后台进程

在Oracle数据库启动时，需要启动多个后台进程，包括CKPT、DBWn、LGWR等进程。这些后台进程主要负责数据库的日志、检查点、缓存管理等操作。

5. 恢复数据库

如果Oracle数据库在前一次关闭时出现异常，需要进行恢复操作。数据恢复的过程主要包括日志重做、回滚数据等操作。

6. 执行用户脚本

在Oracle数据库启动完成之后，需要执行用户脚本，包括初始化脚本、配置脚本等。这些脚本可以用来初始化数据库对象、配置存储路径等。

三、Oracle数据库启动的原理和机制

1. Oracle数据库启动的原理

Oracle数据库启动的原理主要是基于共享内存和进程通信的机制。SGA是Oracle数据库中的共享内存区域，其中存储了大量的数据库缓存和系统状态信息。在启动数据库时，需要初始化SGA，并且所有的进程都可以访问这个共享内存区域。进程之间通信的方式主要是基于共享内存和信号量的机制。

2. Oracle数据库启动的机制

在Oracle数据库启动时，会创建多个进程和线程，包括监听进程、后台进程、用户进程等。监听进程负责接受客户端连接请求并将请求传递给相应的进程处理。后台进程主要负责数据库的管理和维护，包括缓存管理、日志管理、检查点等。用户进程则是客户端连接到数据库时创建的线程，用于处理客户端提交的SQL语句。

Oracle数据库启动的机制主要是基于多进程和多线程的机制，通过这种方式可以充分发挥多核CPU的性能，提高系统的吞吐量和响应速度。

四、

Oracle数据库启动是一个比较复杂的过程，在启动前需要进行多项准备工作，包括环境变量的设置、数据库参数的配置等。在启动过程中，需要创建多个进程和线程，并对SGA进行初始化和管理。通过对Oracle数据库启动的原理和机制的深入分析，可以更好地理解Oracle数据库的工作方式和机制，为数据库的运维和优化提供有益的参考。

相关问题拓展阅读：

谁能介绍下oracle数据库的前滚rolling forward原理吗？

谁能介绍下oracle数据库的前滚rolling forward原理吗？

在一个事务没有提交之前，它的脏块有可能已经被写入到数据文件中。在实例恢复时，roll forward之后会进行roll back，这时已经被写入数据文件的未提交的事务会被回退。

事务具有acdi四大特性：

a（atomicity）：原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。

c(consistency)：一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状态。

i(isolation)：隔离性表示在事务执行过程森猜慎中对数据的修改，在事务提交之前对其他事务不可见兆伍（再此敬没又提交只是对内存中的数据进行的操作）。

d(durability)：永久性表示如果事务提交成功之后，对数据的修改将是永久的。是指一旦做了rollback就不能在提交了。反之一旦提交了就不可以回滚了。

原子性是手段，一致性是目的。

偶然的一次，网友在t.askmaclean.com ASK Maclean Home提问了培芹吵关于11.2 上一个ORA-600问题的解决途径，我们这里不讨论该ORA-600错误，比这个错误本身更有趣的是该600 trace中记录了一段对于前滚恢复rolling upgrade描述十分详细的KST trace。

很多网友肯定要问什么是KST? KST是9i以后引入的内部诊断机制Tracing Facility，每一个Oracle 进程都维护SGA中的一小块Trace buffer，并将自身的默认启用的一些event事件信息写入到Trace Buffer中(这些事件默认包括10280, 10401, 10441, 10442, 10425, 10427, 10429, 10434, 10666)，可以使用内部视图x$trace观察这些信息，默认Trace Buffer不写到磁盘上，而只在SGA中维护，当Trace Buffer用完时将被重用。

了解了 KST的知识后，我们可以从容地阅读下面这段TRACE了：

Trace Bucket Dump Begin: default bucket for process 19 (osid: 29785)

TIME(*=approx):SEQ:COMPONENT:FILE@LINE:FUNCTION:SECT/DUMP: DATA

以上是KST Trace的头部

COMPONENT 组件名例如首山 db_trace 、CACHE_RCV，这里的CACHE_RCV意为 cache recovery，实际上是我们所说的前滚rolling forward。

FILE@LINE 指oracle内核代码的文件名和行数例如:kst.c、kcv.c，这些都是oracle的核心C代码名

FUNCTION 指oracle内核函数名例如kcvcrv()、kctrec()

即 EVENT ID:PID:SID

DATA 实际的操作配侍内容

我们选择性地阅读KST TRACE的内容：

:40:52.:800005B3:CACHE_RCV:kcv.c@15475:kcvcrv(): kcvcrv: Entering kcvcrv():40:52.:800005B4:KFNU:kfn.c@2200:kfnPrepareA(): kfnPrepareA force=0 state_kfnsg=0x7

:40:52.772999*:800005B5:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 1 – cpscn 0x0000.018b76b2, rs 0

:40:52.826001*:800005B6:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 2 – cpscn 0x0000.018b76b2, rs 0

:40:52.862023*:800005B7:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 3 – cpscn 0x0000.018b76b2, rs 0

:40:52.909981*:800005B8:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 4 – cpscn 0x0000.018b76b2, rs 0

:40:52.945933*:800005B9:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 5 – cpscn 0x0000.018b76b2, rs 0

:40:52.993824*:800005BA:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 6 – cpscn 0x0000.018b76b2, rs 0

:40:53.005829*:800005BB:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 7 – cpscn 0x0000.018b76b2, rs 0

:40:53.041893*:800005BC:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 8 – cpscn 0x0000.018b76b2, rs 0

:40:53.065779*:800005BD:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 9 – cpscn 0x0000.018b76b2, rs 0

:40:53.089760*:800005BE:CACHE_RCV:kcv.c@16100:kcvcrv(): kcvcrv: file 10 – cpscn 0x0000.018b76b2, rs 0

kcvcrv的全称是 ernel ache ecovery rash ecovery erify ， kcvcrv内核函数在crash recovery的过程中显得极为重要，它总是发生在当一个前台进程试图启动脏关闭(dirty shutdown)的数据库的时候。kcvcrv 的工作包括检验所有的数据文件头并验证控制文件中的数据文件记录以确认是否需要介质恢复。这个步骤必要地验证仅仅crash recovery是否足以让数据库恢复到一致状态(consistent)，相信大家已经耳熟能详 crash recovery 、 instance recovery 、 media recovery 三者的区别。若kcvcrv发现 data files数据文件、control files控制文件亦或者redo log file在线日志文件存在corrupted 或者丢失，或者实际上是从之前的备份中还原过来的，那么kcvcrv会强制用户必须使用media recovery才能将数据库恢复到一致，无法通过crash recovery实现恢复。注意 kcvcrv的检测并不是完全的，它主要是检测数据文件头的checkpoint scn 和控制文件中data files的checkpoint scn是否一致，以确保这些数据文件完成了shutdown instance时的最后一次FULL Checkpoint。 kcvcrv并不能检测出除数据文件头部外的datafile body是否存在介质讹误。

kcvcrv需要对control file读写才能完成其必要的任务，所以它会启动一个控制文件读写事务 read-write control file transaction。通过检验控制文件中每个数据文件的记录以确认数据文件是否有被重新同步的必要。当然kcvcrv会跳过哪些OFFLINE和read-only的数据文件，因为这些文件不存在recovery的必要。

在确认crash recovery的必要性后，kcvcrv还会主导启动并行的恢复工作(parallel recovery)，注意parallel recovery只在多CPU且参数recovery_paralleli不为零的环境下有效， kcvcrv会创建并初始化Oracle中的PQ Slave 并行子进程以便恢复实例。默认的子进程数Slave Processes等于(CPU的总数-1)，这是因为需要为recovery coordinator process恢复协调进程保留一个CPU。并且需要kcvcrv分配一个recovery state object给并行恢复协调进程与其Slave子进程。

最后kcvcrv还会调用另一个关键内核函数 kctrec ( Kernel Cache Threads )， kctrec会在所有打开的redo thread上实施进一步的thread recovery。

:40:53.::KFNU:kfn.c@2200:kfnPrepareA(): kfnPrepareA force=0 state_kfnsg=0x7

:40:53.366569*::CACHE_RCV:kcv.c@16365:kcvcrv(): kcvcrv: Calling kctrec()

:40:53.366569*::CACHE_RCV:kct.c@4163:kctrec(): kctrec: Entering kctrec()

:40:53.413557*:A:CACHE_RCV:kct.c@4271:kctrec(): kctrec: thread 1 cf thread ckpt: logseq 1468, block 2,scn

常见的 kcvcrv 调用堆栈 stack call如下：

kcratr_odr_check

kcliarq

kfgrpIterInit()

关于oracle数据库启动原理的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

数据运维技术 » 探析Oracle数据库启动的原理与机制 (oracle数据库启动原理)

分享到：

谁能介绍下oracle数据库的前滚rolling forward原理吗？

相关推荐