ORA-29740:evicted by member %d, group incarnation %d
這個錯誤是在 rac 底下出現(xiàn)的,應該算是個比較嚴重的錯誤,就是 某個節(jié)點 被 踢(evict)出去了,導致這個節(jié)點重啟系統(tǒng)。
這個錯誤的原因多種多樣,而且需要找的日志文件也是很多的,基本上,能找的日志都要找過去,直到能基本確定 問題根源為止,不過,這里有個指導性的 解決思路。
我們需要去查看 LMON 的trace 文件
On the evicting instance we will see something like:
kjxgrrcfgchk: Initiating reconfig, reason 3
*** 2022-11-20 18:49:29.559
kjxgmrcfg: Reconfiguration started, reason 3
重點關注 reason n 這個數(shù)字,因為 每個 reason 基本上對應不同的 錯誤內(nèi)容:
Reason 0 = No reconfiguration
Reason 1 = The Node Monitor generated the reconfiguration.
Reason 2 = An instance death was detected.
Reason 3 = Communications Failure
Reason 4 = Reconfiguration after suspend
這里,介紹下 reason 1,2,3
Reason 1 一般是由于 增加或刪除rac 節(jié)點成員產(chǎn)生的,一般情況下,不會產(chǎn)生 reason 的問題。
Reason 2 一般是由于
a) NTP (Time changes on cluster) - usually on Linux, Tru64, or IBM AIX
b) Network Problems (SAN).
c) Resource Starvation (CPU, I/O, etc..)
d) An Oracle bug.
這個錯誤沒有明顯的 判斷標準,只能查看 各個 日志來判斷可能引起的原因
Reason 3 一般是由于
a) Network Problems.
b) Resource Starvation (CPU, I/O, etc..)
c) Severe Contention in Database.
d) An Oracle bug.
這個錯誤很可能是由于節(jié)點間的通信造成的,所以,首先先看看節(jié)點間的通信是否有問題。
