现在知道都发生啥了,公告出来了.
本次事故流程:
發現資料庫Master主機 hdd 故障
進行備用機更換,同時通知機房處理故障機
備用機更換完成
備用機上線後發現Tracker主機故障
打算把tracker先上線到已修復的故障master機
已修復的master機 ipmi 故障
開始跟機房鬼打牆溝通,因為他在lan內是可以正常連線的
這時間沒辦法只好先把測試站的主機先拿來上線,但是因為環境不同浪費了很多時間
在測試環境的主機上線了tracker,但是因不明原因統計錯誤,只好又關閉
記得那台故障的ipmi嗎,它還是故障的
故障的tracker主機經溝通同意更換硬件(終於)
現階段由於無機可用,一台ipmi故障,一台在更換硬件,所以先行上線至web機共存
目前進度等候原tracker更換完成再進行還原