発注者が知っておくべき障害管理のポイント~インシデント管理

更新日:2017年08月07日 | 公開日:2017年08月07日

発注者が知っておくべき障害管理のポイント~インシデント管理

障害管理とは、システムの障害発生時に必要な人員、経費、スケジュールなどをあらかじめ決めておき、障害が発生したときの安全性を向上させることを言います。
障害管理を効果的に行うには、対処手順のマニュアル化、実際に起こった障害を記録するなど障害が起きたときの対策をしっかり練っておくだけでなく、システムの監視をして障害を事前に予防することや、障害が起きてしまったあとにその教訓をナレッジとして蓄積して組織的に共有することなどが含まれます。

こうした障害管理のなかで、特にユーザーの視点に立って障害に対処する方法として「インシデント管理」があります。
「インシデント」とはユーザーがやりたいと思っているオペレーションが実行不可能な状態を指します。
例えば、プリンターから資料が出力できないという状態を「インシデント」と言いますが、これは必ずしもシステム的な障害が起きているという状態を指しません。
例えば「コピー用紙が切れている」であるとか「紙詰まりを起こしている」といった状態もユーザーがやりたいと思っているオペレーションが実行できない状態なので「インシデント管理」の対象になるのです。

この記事では、こうした「インシデント管理」をどのように実施していくかのポイントを整理し、便利なインシデント管理ツールを厳選してご紹介します。

ユーザーの立場を優先する「インシデント管理」の特徴

従来の「障害管理」に対するイメージからすると、この「インシデント管理」という視点はかなり斬新なものです。
もちろん、プリンターが接続しているネットワーク回線が故障していたり、プリンターそのものが故障したりしているといった従来の意味での障害管理への対応も「インシデント管理」に含まれます。
インシデント管理とは、これまでシステム的な障害に限って行っていた障害管理をユーザー視点でとらえ直し、より総合的に業務の遂行を滞りなく実行するための枠組みなのです。

インシデント管理における解決方法も、従来の障害管理とは違っています。
インシデント管理では、システム的な障害を取り除くことが必ずしも解決というわけではありません。
「プリンターが使えない⇒そのプリンターの障害を取り除く⇒そのプリンターを使えるようにする」が従来型の障害管理の基本ですが、インシデント管理では、そうした対応を含みながら「プリンターが使えない⇒他のプリンターを用意する」という対応方法もアリなのです。

また最近の定義では、将来やりたいことができなくなる状態に関しても「インシデント」に相当するとしています。
例えば、現在は紙詰まりを起こしてはいないが、プリンターの給紙部分から毎回紙が強くこすれるような音が頻繁に起きている、という状態は近い将来ユーザーがプリンターを使ったオペレーションができなくなるという可能性を示唆していますので「インシデント」に相当します。

このように、インシデント管理の基本は徹底的にユーザー視点で障害をとらえるということです。
ユーザーが本当に望んでいるのはシステム的な障害を取り除くことではなく、使えるようになるということです。
システム管理者からすると、プリンターそのものの不具合に対処せずに、代替プリンターを持ってきてユーザーに提供するというのは職務怠慢のように感じてしまうかもしれません。
しかし、視点を変えてユーザーの立場に立ってみれば、いつ復旧する変わらないシステム的な不具合の根本的な解決よりも、午後の取引先との打ち合わせにプレゼン資料の出力が間に合うかどうかの方が切実な問題なのです。

インシデント管理の例

インシデント管理は従来の障害管理に比べて徹底的にユーザーの立場に立ちます。
従来型の障害管理しかイメージできないという場合には、インシデント管理の方法がかなり異質に見えるかもしれません。
そこで、まずは従来型の障害管理との違いを挙げてみます。

インシデント管理の例
  • メール送受信しようと思ったら、ログインできなかった
  • アプリケーションを起動しようとしたらOS全体がフリーズしてしまった
  • 印刷しようとしたら、用紙切れだった
  • グループウェアにログインするパスワードを忘れてしまった
  • 新しいシステムの使い方がわからない

このなかで、従来型の障害管理の対象はせいぜい「メール送受信しようと思ったら、ログインできなかった」「アプリケーションを起動しようとしたらOS全体がフリーズしてしまった」の2つでしょう。
しかも、前者に関しては結局、昨日セキュリティ強化のために管理者がパスワードのリセットをしたという通知を受けていながら、新しいパスワードでログインしなかったことが原因と判明するかもしれませんし。
後者に関してもユーザーが使っているパソコンのメモリ不足かもしれません。

しかし、インシデント管理ではこうした状態もすべて解決すべき対象とします。
これまでの障害管理では明確にシステム的な原因のある「アクシデント」のみを対象にしてきましたが、本来「障害に対処する」とは技術的な不具合の解消が最終目的ではなく、業務を滞りなく遂行して会社に与える損失を最小限にする、ということです。

そうした障害管理の原点の大切さが徐々に認識されるなか、今後はこうした「インシデント」の管理がますます重要になってくるでしょう。

システム管理者に求められるインシデント管理の視点

インシデント管理を進めるにあたって、最初に障害になるのは実は障害管理を担当するシステム管理者の意識です。
インシデント管理は徹底的にユーザーの立場を優先しますので、システム的な障害の原因の除去が最終目的ではなく、ユーザーがシステムを使える状態にすることが最も大切になります。

インシデント管理を行うためには、システム管理者の意識を技術志向からユーザー志向に変化させなければなりません。

インシデント管理者に求められる責任・役割・スキル

それでは、具体的にインシデント管理者に求められる責任と役割について見ていきましょう。
従来型の障害を対象に含みつつも、徹底的にユーザー視点になっていることに注意してください。

インシデント管理者の責任
  • ユーザー視点の障害管理体制の手順・方法を確立し、その実施・維持・改善を行う
  • 障害の技術的除去・改善にとどまらず、インシデント管理施策の実施状況、改善の必要性の有無などをCIOや情報システム部門と共有する
  • ユーザー視点に立った情報システム運用に関わる方針や目標を社内に周知する
インシデント管理者の役割
  • 技術的な問題解決ではなく、ユーザーのオペレーションが再開できるように最善を尽くす
  • インシデント解決につながる問題を早期に発見できるように、障害の予兆の報告など、自発的かつ活発なコミュニケーションを促す
  • 障害の予兆となることが多いヒヤリハットを見逃さないためのコミュニケーションを行う
インシデント管理者に求められるスキル
  • 危機管理能力
  • クリティカルシンキング、問題の早期発見
  • 情報システム運用に関する知見・スキル
  • コミュニケーション能力

ツールを使ったインシデントの復旧処置

ここまで見てきたように、インシデント管理に対応するには最初にシステム管理者の意識の変革が必要です。
いったんインシデント管理の責任者がユーザーの問題解決最優先という視点を持ったあとは、インシデント管理を効率化するツールを積極的に取り入れていきましょう。

おすすめインシデント管理ツール4選

RSA Archer GRC Platform/EMCジャパン

公式ページ

「RSA Archer GRC Platform」は、部門や拠点などで個別に管理されている障害情報やリスク管理情報を集約して、障害管理の透明性や活用効率を向上させる管理プラットフォームで、監査の対応準備や監査実施におけるコスト削減、最優先リスクの迅速な把握と対応の短縮、新しい規制に対する順守を証明するまでの時間の短縮、プロセス、情報、システムの統合による運用コストの削減、事業担当者や外部取引先間のポリシー、目標、責任範囲に対する認識の向上などを効率よく実現してくれます。

具体的には、インシデント管理のほかにも、ポリシー管理、リスク管理、コンプライアンス管理、エンタープライズ管理、脅威管理、ベンダー管理、事業継続管理、監査管理に対応しています。

LMIS on cloud/ユニリタ

公式ページ

「LMIS on cloud」は、Force.com上で開発されたクラウド型ITサービスマネジメントツールです。
導入されているシステムで生じる各種イベントを記録、分類してインシデント発生、問題特定、システム変更、再リリースなどを一連のプロセスとしてまとめて管理してくれます。

手作業でこれらのプロセスを行うとかなりの手間がかかりますが、LMIS on cloudを使うことで、運用プロセスの改善、承認ルートの確立、手順の明確化、作業品質の向上といったメリットが得られます。

特にインシデント管理については、システムが異常終了した場合に、ネットワーク名、日時、ステータスといった情報をLMIS on cloudのCMS(構成管理システム)にインシデントとして自動登録するといったことも可能になっています。

SmartStageサービスデスク/株式会社クレオ

公式ページ

「SmartStageサービスデスク」は主に中規模以上のオフィスにて、ユーザーから寄せられる多数のインシデントの洪水を乗り切る業務プロセス改善ツールとして機能します。

具体的にはインシデント受付、問題特定、システム変更、再リリースの4つのプロセスで構成されており、SmartStageサービスデスクで自社の業務フローにマッチしない部分は管理画面より設定変更が可能となっています。

こうした柔軟なインシデント管理機能を持っているので、運用を具体的に進めながら、PDCAサイクルなどを活用して自社内で管理マスターをブラッシュアップしていくことができます。

インシデントプロセスではお問い合わせや障害連絡の受け皿としてだけでなく、他の監視ツールのアラートメールなども取り込み可能となっているので、インシデントツールを統括する管理システムとしても活用できます。

FootPrints Service Core/ニスコム株式会社

公式ページ

「FootPrints Service Core」は、膨大な情報が寄せられるインシデントサービスデスクの課題を解決します。
具体的には、インシデント管理の現場で直面する「問い合わせが多く、対応が追い付かない」「担当者が個別に電話やメールで対応しているため、状況の共有ができていない」「ナレッジの共有、蓄積ができておらず、属人化されている」「機器情報が点在しており、対応に時間がかる」などの課題解決をサポートします。

特にインシデント管理はゼロから作成することなく、付属のテンプレートをカスタマイズすることで、自社の対応すべきインシデントの作成をスピーディーに支援してくれます。

インシデント管理をアウトソーシングするなら

さて、いかがだったでしょうか。
ここまで「インシデント管理」という考え方の特徴や実施にあたってのポイント、ツールなどを見てきました。
インシデント管理を導入するためには、従来型の障害管理とは違ったシステム管理者の意識変革が必要になるケースが多いので、導入に時間がかかることもあります。

またこの記事で紹介した定評のあるインシデント管理ツールを導入する場合にも、大切になってくるのは自社のインシデント管理ポリシーをどのように策定して、軌道に乗せていくかです。

ユーザー志向の障害管理に魅力を感じつつも、こうした従来型の障害管理とは違うインシデント管理導入に関して不安がある…という場合にはぜひ「アイミツ」にお声をおかけください。
インシデント管理のポリシー策定から、ツールの導入支援、さらにインシデント管理自体のアウトソーシングまで、御社のご要望に合わせて最適なパートナーをご紹介いたします。

見積もり、取ってますか?

発注をする際に最も大切なことは適正価格を知ることです。
3~4社から見積もりを取ることで、
発注への納得度を高めることができます。

コンシェルジュ

発注は時間も手間もかかりますよね?

コンシェルジュが解決します!

コンシェルジュに相談、あなたにあった業者を提案、発注の手間を削減!

完全無料

まずはお気軽にご相談ください