ITILインシデント管理と問題管理を詳しく説明

DevOps
インシデント管理と問題管理の違いを理解していますでしょうか。ITILでは詳しく明記されております。ちょっと観点がちがいますので、詳しく覚えることが必要となります。

インシデント管理と問題管理の違いは?

  • インシデント管理:現状復帰
  • 問題管理:インシデントの原因特定と対応策の立案

ITILインシデント管理

インシデントと問題を完全にわけたことが最大の発明

ITIL最大の発明とは、この「インシデント」と「問題」を完全に分離したことにあると言われています。

定義は、「サービスの標準の運用に属さないイベントであり、サービス品質を阻害、あるいは低下させる、もしくはさせるかもしれないイベント」です。

ITILインシデント管理の定義は?

 インシデントの発生時において、可能な限り迅速にサービスを正常な状態(標準の運用)に復旧させることです。
インシデントによるビジネスへの影響を最小限に抑え、ITサービスの品質を維持する管理プロセスになります。

インシデントとは

 ITILにおけるインシデントとは、通常のITサービス/ITシステムの停止やサービス品質の低下により、ビジネスの継続やユーザーに影響を与える「できごと」をいいます。

管理とは

 ITILにおけるインシデント管理とは、ビジネスへの影響を最小限に抑え、迅速にITサービス/ITシステムを復旧することを目的とした、ITサービスマネジメントのプロセスのことをいいます

インシデント管理の注意事項

  • インシデント=障害ではない。

  • 利用者が取り除いてほしいのがインシデントであった、障害ではない。やりたいと思うことができるようになることが必要。やりたいことができないという状態を取り除いてあげるための活動を指します。

インシデント管理で重要なこと

インシデントの「記録」と「共有」をしっかりと行える環境を作るためにも、インシデント管理ツールは「現場の求める使いやすさ」と「変化に柔軟に対応できる」ことが重要です。

問題管理とは?

問題とは

インシデントを引き起こした原因のことを「問題」と呼びます。この「問題」を管理するプロセスが問題管理です。

問題管理とは

発生したインシデントの根本原因(問題)を究明し、恒久的な対応策を実施することを目的としています。この活動により、既知の問題に起因するインシデントの再発を防止するとともに、予防に限界があるインシデントによる悪影響を最小限に抑えます。

問題管理の重要性は?

インデント管理では可能な限り迅速な対応が要求されましたが、このように問題管理では時間をかけてでも根本原因を究明することが要求されています
インシデントの根本原因(問題)を究明し、再発の防止といった恒久的な対処(ワークアラウンド)を実施する問題管理なのです。

問題管理のトリガーは2つ

過去に経験をしたことがないインシデント

発生したインシデントが過去に経験したことのない障害で、根本原因を新たに探る必要があるようなケースを指しています。

解決したはずのインシデントが再び発生したとき

 過去に根本原因を特定し解決済みのはずなのに再び、同じようなインシデントに見舞われたときのことをさします。
これはすなわち、特定したと思っていた根本原因が、実は、真の意味での根本原因でなかったか、または、それに対する解決策が正しく実行されていなかったことを意味するため、再度、真の根本原因究明のための活動(問題管理)が必要になるわけです。

問題管理に欠かせない活動は?

問題の記録・分類

問題の検出とそれら全ての記録を行うための活動
問題が認識された時点で、発見された問題への対応し忘れを防ぐために、特定された問題の
基礎情報(例:関連するインシデントの情報、問題の発見者など)について記録をしておくことが必要不可欠です。

問題の調査・診断

 「問題」として認識され、対応が必要なものが複数ある場合には、対応するリソースに限りがあることから、対応の優先順位付けを行う必要があります。
ここで分類された優先順位にもとづき、より優先度の高い問題から、調査を開始し、根本原因の究明する必要があります。

エラー制御

特定できた問題の根本原因について、実質的な解決策を施し、再発防止を図ります。

問題のクローズ

問題を解決できた場合には、その対応結果を今後のナレッジベースとして活用するため、その問題の発生経緯や解決策など基本的事項を詳細に記録しておくことが重要です。

タイトルとURLをコピーしました