クラウド関連技術ブログ

ITIL 第2回 インシデント管理 大地に立つ!!

投稿日:2013/12/11カテゴリー:ITIL

んにちは。
FL.OPSの中の人その2、DAO(だお)です。

第2回の今回もITIL (アイティル)について解説します。
本来はサービスデリバリについてのお話をする予定でしたが、前回のサービスサポートはとても
重要な部分ですので各プロセス毎に、もう少し詳しくお話したいと思います。

今回はインシデント管理について詳しく解説をします。

(1)インシデント管理とは
サービスレベルを維持し、サービスデスクを支えるプロセスのこと。
ITILのサービスサポートではインシデント管理の定義を「可能な限り迅速に通常のサービス運用
を回復することであり、ビジネスへの悪影響を最小限に抑え、提供可能な最高のサービスにおい
て品質と可用性を維持すること。」と解説しています。

(2)インシデントの定義
ITILの「サービスサポート」には以下のように定義されています。
サービス標準の運用に属さないイベントでありサービス品質を阻害、あるいは低下させる、もし
くはさせるかもしれないあらゆるイベント

つまり、ハードウェアやソフトウェアに関する事象のみではなく、パスワードを忘れたユーザの
再通知依頼対応などの直接システムには影響しない人間が発生させたイベントに関してもITILで
はインシデントとして取り扱います。

(3)インシデント、問題、既知のエラーの違い
上記で解説した「インシデント」と類似した用語として「問題」と「既知のエラー」が存在します。
ともすれば、混同しそうなこれらの用語の違いについて、解説します。
①問題
ひとつ以上のインシデントを引き起こす、未知の根本的な原因
②既知のエラー
既に正しく診断・解決され、ワークアラウンド(*1)もしくは永久的な解決策が存在するもの
*1:ワークアラウンド…暫定的にインシデントや問題を回避する措置

(4)インシデント管理導入のメリット
インシデント管理を導入すると以下のような恩恵にあずかれます。
・管理されたインシデント対応が行われることでインシデントの早期対応・解決が可能になり、
ITサービスの品質安定化を図ることが可能になります。
・利益あるシステム拡張と修正を積極的に認知できます。
・SLAに関する、ビジネスにフォーカスした管理情報を入手できます。
・管理、整理された過去のインシデント情報を参照することが可能なため、効率のよいインシ
デント対応が行えます。
・スタッフの稼働率向上による効率のようITサービス運営
・インシデントやサービス要求の喪失あるいは間違いを削減できます。

つまり…
サービス提供側のメリット
⇛正確で迅速、かつ効率のよいインシデント対応を提供することにより顧客満足度の向上を図る
ことができる。
サービス利用者側のメリット
⇛正確で迅速、かつ効率のよいインシデント対応を受けられる事により安心感を得ることができ
る。

(5)インシデントライフサイクル
インシデント管理は「インシデントライフサイクル」と呼ばれる以下のような流れに沿って実施します。
①インシデントの検出及び記録
インシデントの対応に必要な情報の整理を行う活動のこと。
・原則として全てのインシデントが記録されるべきであり、記録される内容は「症状の概要」
「関連する構成アイテム」「記録日時」「通知してきたユーザの氏名・連絡先」
・インシデントの対応経過(対応方法、クローズ日時など)についても随時記録を行う。

②分類及び初期サポート
効率良くかつ確実にインシデントを解決するための分析・分類活動のこと。
具体的な解決プロセスは以下のとおり
ⅰ)影響度、緊急度を判定し、その結果に基づいて優先度をつける
ⅱ)インシデントをカテゴリ、影響度、緊急度、優先度に基づき分類する
ⅲ)既知のエラー及び問題に対して照合する。
ⅳ)初期サポートを提供する。
ⅴ)初期サーポートにて解決した場合、インシデントをクローズする。
ⅵ)分類が適切にできなかったり初期サーポートにて解決できないと判断された場合、専門家に
エスカレーションする。
ⅶ)新しい問題や多重インシデント情報を問題管理に提供する。

③調査と診断
インシデント解決に向けた専門家による高度な分析を行う活動のこと。
インシデントの解決には「ワークアラウンド」や「永久的な解決」があります。

④解決策と復旧
上記③で判明した解決策を用いてインシデントを解決し、サービスを復旧させる活動のこと。
具体的な処置は以下のとおり
ⅰ)解決策/ワークアラウンドを活用してインシデントを解決あるいはRFC(変更要求)を行う。
ⅱ)復旧処置を取る。
次ステップにてインシデント解決の報告を実施する必要があるため、解決及び復旧活動中
のイベントや処置については適切に記録を取っておく必要があります。

⑤インシデントのクローズ
インシデントが解決し、サービスが復旧したことの同意を得て対応を完了させる活動のこと。
具体的な処置は以下のとおり
ⅰ)ユーザや報告者にインシデントが解決したか確認を行う。
ⅱ)インシデントのステータスをクローズにする。
ⅲ)インシデントを整理する。
また、インシデントのクローズにあたり、サービスデスクが利用者に保証することは以下のとお
りです。
ⅰ)インシデントの解決のために取られた処置の詳細が完結で読みやすいものであること
ⅱ)根本原因に応じて分類が完了し、正確であること。
ⅲ)解決策/処置についてユーザとの合意を取る(書面が望ましい。)
※サービス提供側とユーザ間での論争を回避するため、クローズの定義を明確にする。

⑥オーナシップ、監視、追跡、コミュニケーション
インシデント管理のお目付け役的な活動のことで、インシデント管理の活動が適切に実施される
ようにコントロールを行うこと。
具体的な活動は以下のとおり。
ⅰ)影響度、緊急度を判定し、その結果に基づいて優先度をつける
ⅱ)インシデントをカテゴリ、影響度、緊急度、優先度に基づき分類する
ⅲ)既知のエラー及び問題に対して照合する。
ⅳ)初期サポートを提供する。
ⅴ)初期サポートにて解決した場合、インシデントをクローズする。
ⅵ)分類が適切にできなかったり初期サポートにて解決できないと判断された場合、専門家に
エスカレーションする。

インシデント管理について、メリットやライフサイクルについて解説を行いましたがいかがでしたか?
難しい言葉で書いてあるように見えますが、内容は至ってシンプルです。
シンプルではありますが、インシデント管理を確実に行うことはとても大変です。
しかし、このインシデント管理がITサービスの運用を円滑に回すための重要なキーとなりますので、しっかりと行いましょう。

次回は問題管理について解説します。

CONTACT

tel 092-986-2772
10:00〜17:00(土・日・祝日除く)
お問い合わせフォーム
page top