会社経営において、システム障害が発生するとたちまち事業が停止してしまうことは少なくありません。
多大な損失を抱えるだけでなく、損害賠償請求のリスクも考えられるシステム障害ですが、具体的にどのような状態を指すのでしょう。
そこで、システム障害とはどのような状況に陥ることなのか、発生したときの対応や備えに必要なことについて説明していきます。
システム障害とは
「システム障害」とは、何らかの原因により情報システムが動作しなくなることや、誤った動作や処理の著しい遅延が見られるといった事象のことです。
情報システムを構成している機械・通信回線・ネットワーク・ソフトなどに問題が発生したことにより、正常な機能が維持できなくなることを意味します。
銀行や行政機関などでシステム障害が発生した場合、社会全体に大きな影響を及ぼすこととなります。
その原因として考えられるのは、
・設計ミス
・ハードウエアの故障
・負荷の急激な増大
・サイバー攻撃
・停電・自然災害
などです。
システム障害の種類
システム障害として挙げられるのは、
・ハードウェア障害
・ソフトウェア障害
・人為的ミスに起因する障害
の3つです。
システムやネットワークに障害が発生する原因は様々ですが、一時的にアクセスが集中し回線やサーバーがハングアップすることなどしばしば起きています。
このような状況においては早期復旧することが求められますが、冷静・確実な復旧作業のためにも事前の準備が大切です。
システム障害が発生したときへの備え
システム障害はいつ発生するか予測がつかないため、起こりうるトラブルの予測や被害を最小限に抑える事前準備がとても大切です。
管理対象となるシステム構成図・ネットワーク図・設定情報・グループポリシー・ライセンス情報などが必要となりますが、実際にトラブルが発生したときの症状から原因までの追究と修復にむけて準備しておきましょう。
さらに発生した障害のレベルに応じた対応について、マニュアル化しておくことも必要です。
修復できた後は、ユーザーに対しシステム障害があったことを情報として通知すればよい程度なのか、それとも一時的なサービス停止が必要なのかの判断も必要になります。
そのため想定される障害をいくつかのレベルごとに分類し、それぞれの対応を設定しておくとよいでしょう。
システム障害発生時の作業の流れ
システム障害発生後は、事前に作成していたマニュアルに沿って対応していくことになります。
一般的なシステム障害発生作業の流れとして、次の3つが挙げられます。
①影響範囲を確認しそれぞれの部署へ連絡
②監視システムによる自動復旧
③エンジニアによる原因の切り分け
この3つの処理で当座をしのぐ応急処置を施し、根本的な修復は時間をかけて行うといった二段構えの作業が必要です。