8月25日の日経ITProのサイトを見ていると、「判明した残念な事実、システム全面ダウンが再び増加」という記事がありました。気になったので、中身を読んでみました。
すると、システムダウン596件のトラブル事例を調査したところ、全ダウン件数のうち全面ダウンの件数は下
記のように推移しているそうです。
- 1980年代 全面ダウン 67.9%
- 1990年代 全面ダウン 44.6%
- 2000年代 全面ダウン 27.1%
- 2010年代 全面ダウン 34.3%
1980年代はメインフレームやオフコンが全盛の時代で、システムの冗長化技術も発展途上だった時期だと思います。
1990年代はミッションクリティカルなシステムはメインフレームで守られて、それ以外のシステムはオープン化が進み始めた時期です。2000年代はその傾向が最も顕著に表れていた時期でしょう。一部、ミッションクリティカルなシステムについてもオープン化の動きが出ていた時期でもあります。
そして、2010年代はそれまでメインフレームで運用されていたシステムも相当な割合でオープン化が進められました。再び、2010年代に全面ダウンの比率が増えているのは、このオープン化の動きと関連していると思います。
特に全面ダウンに至るトラブルの要因はサーバーに起因するものが多く、2010年代では39.1%にものぼります。現用系システムの異常発生時に待機系システムへの切り替えで失敗したケースや小規模なサーバーの異常が他のシステムに影響を与えてしまってダウンさせてしまうケースです。
ネットで2010年代のシステム全面ダウンの情報を検索すると
- 2012年のソニー銀行のトラブル
→無停電電源装置の障害が一次要因
- 2016年の全日空のトラブル
→シスコ製スイッチのバグ
などが見つかりました。
以前、メインフレームの頃には富士通、日立、日本電気、IBMなどのハードウェアベンダーがミドルソフトも含めて垂直統合で製品の品質を保証していました。
しかし、オープン化によってハードウェアベンダーとミドルソフトのベンダーは異なるようになり、その組み合わせによる品質の保証は利用者側に重くのしかかってきています。
オープン化という発想そのものは間違っていないと思うのですが、例えば電源コンセントのように規格をシンプルにできず、物理的な信号の大小やプラグの物理的形状のみならず、電文フォーマット、タイミング等、考慮すべき要素が極端に多くなっています。現状は単純に製品をポンと組み合わせれば動く世界ではなくなってしまっています。
さらにオープン系のサーバーになったことにより、システムが乱立するようになり全体を抑えにくくなってきている状況もあります。バラバラに調達をかけたことにより、ベンダー側も全体を見通すことができずに、やはり発注者側に負担が重くのしかかる現状があります。
オープンの世界も規格がもっと明確に決まって行き、サーバーも能力の向上により過度な分割が是正されていけば、状況も変化すると思いますが、それまではシステム全面障害の割合は高止まりするように思います。
コメント