2023年4月10日月曜日

ANAのシステム障害

去る4月4日、ANAのシステムが不具合を起こし、
飛行機の発着遅延や欠航が発生したとのこと。
その前日にNTT東西の通信網でのトラブルが発生しましたが、
年度始めって何かが起こりがちなんでしょうかね。

さて、今回のトラブルの原因について発表がありましたが、
DBサーバが落ちてシステムダウンしたとのこと。
そもそもこのシステムでは同一構成の本番系と待機系があり、
それぞれの系でDBサーバが二重になっていて
常時レプリケーションされており、
この2つのDBが同時に落ちたとのこと。
残念ながら待機系はホットスタンバイ状態ではなかったのか、
復旧にはある程度の時間がかかったようですが、
翌日には本番系のDBも回復して通常営業に戻れたみたいです。

で、原因ですがDBエンジンの既知のバグで、
2018年にパッチがリリース済みとか。
ANAでは運用形態から判断してそのパッチは当ててなかったそうですが、
まあ、そういう判断もあり得ますよね。
心配なのはこれをきっかけにパッチはとにかく全部当てろ
的な風潮になったらいろいろ面倒だなと。
今動いているものに手を入れるのは大変なんですよね。

0 件のコメント:

コメントを投稿