一、服務概述
近期接到用戶告知數(shù)據(jù)庫歸檔暴增,導致生產(chǎn)庫歸檔空間滿,手動刪除后,歸檔空間很快就會滿。
立即登陸數(shù)據(jù)庫系統(tǒng),查詢發(fā)現(xiàn)歸檔日志異常增長,從以前的每小時產(chǎn)生300M,增長到每小時產(chǎn)生59150M。拉取問題時段的AWR報告,將問題SQL提交給應用運維人員,應用修復相應模塊功能后,故障得到解決。故障處理后,依據(jù)當時awr和問題處理過程,匯總此文檔說明此次故障原因及以后的預防措施。
技術(shù)點:
1.? ?ORACLE 11Gr2開始,數(shù)據(jù)庫AWR中的segment部分的block change小節(jié),可以顯示塊變更多的表或索引信息,依據(jù)此信息結(jié)合TOP SQL部分,可以很快速的確定導致產(chǎn)生很多歸檔日志的SQL語句、程序模塊信息等。
2.? 在ORACLE 10G中,只能結(jié)合TOP SQL,進行分析;極端情況下還需要對REDO LOG進行LOGMNR挖掘分析,可以得到引起歸檔日志產(chǎn)生量高的SQL語句。
二、問題處理及相關(guān)日志分析
- 查詢數(shù)據(jù)庫每小時歸檔產(chǎn)生量
歸檔查詢發(fā)現(xiàn),LIS數(shù)據(jù)庫在20220311 22:00:00以后產(chǎn)生的歸檔量大幅增長,不在正常范圍內(nèi),拉取22:00:00-23:00:00的AWR報告進行分析,查出產(chǎn)生大量歸檔的SQL。
- AWR報告分析
通過對數(shù)據(jù)庫AWR報告分析查看,查找update或者delete執(zhí)行很多次的SQL。
首先定位問題發(fā)生的時間點(根據(jù)日志切換頻率)
?收集正常及異常時刻的AWR,進行對比:
正常時間點:
?
問題時間點:
?
?AWR TOP SQL分析:
?
?
在3600秒取樣時間內(nèi),sql_id為2rmbgyhxhp4m3的語句執(zhí)行27820次,結(jié)合客戶反饋,將此SQL反饋給應用開發(fā)商,很快排查出問題,由于采樣編碼設置的最大值為999,當日采樣人員過多,超過上限導致程序混亂,產(chǎn)生大量update,導致歸檔暴增,應用采取加模組方式暫時解決,后續(xù)修改采樣編碼上限。
三、總結(jié)與后續(xù)處理建議
- 故障分析總結(jié)
歸檔日志暴增故障分析:文章來源:http://www.zghlxwxcb.cn/news/detail-437485.html
排查歸檔日志增長原因,發(fā)現(xiàn)歸檔大量產(chǎn)生的原因是問題SQL導致,正常的SQL在出現(xiàn)異常執(zhí)行時,也會產(chǎn)生問題,出現(xiàn)大量的歸檔,應該對SQL執(zhí)行次數(shù)進行監(jiān)控,出現(xiàn)異常執(zhí)行次數(shù)時, 立即處理文章來源地址http://www.zghlxwxcb.cn/news/detail-437485.html
到了這里,關(guān)于ORACLE 10G版本數(shù)據(jù)庫系統(tǒng)產(chǎn)生大量歸檔日志問題的分析的文章就介紹完了。如果您還想了解更多內(nèi)容,請在右上角搜索TOY模板網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章,希望大家以后多多支持TOY模板網(wǎng)!