ITサービス管理のためのテンプレート、ITIL (Information Technology Infrastructure Library)。
そこで定義されるプロセスの中に「インシデント管理」という言葉があります。
言葉だけではピンと来ないかもしれませんが、例えば「Webサイトが接続できない」などのトラブルが起きた時、短時間でサイトへの接続が復旧しているのは「インシデント管理」をしているからです。
この記事では、インシデント管理とはなんなのか、具体的にどんな方法で管理しているのかを解説します。 「自社でIT部門の担当になったけど自信が無い」「聞いたことあるけど良く知らない」 そんな方は、ぜひ参考にしてみてください。
また、情報セキュリティインシデントの基礎知識から事例まで徹底的に網羅した資料をpdfでお配りしております。無料でダウンロードしてご一読いただくと、かなりお役立ていただけます。
インシデント管理とは
「インシデント管理」とは、ITシステムの正常な利用を妨げる「インシデント(問題)」の対応管理です。
ITILにおけるインシデント管理の目的は「業務の復旧」で、インシデントが与える業務への影響を最小限に抑える事を第一として考えられています。
例えば、「サーバーが落ちて、見たいデータにアクセスできない」というトラブルが発生した際、「コピーしてある同じデータを閲覧できるようにする」「別のサーバーに切り替えてアクセスを可能にする」など「データを見たい」といった要望に即座に応えられるようにすることです。
インシデント管理は、根本的な原因を解決するのではなく、「即座に目的を達成する」ことに重きを置いた、応急処置というようなイメージに近いでしょう。
ITの運用管理においてシステムの可用性(システムが継続して稼働できる度合いや能力)を維持する一つの手段として用いられています。
高いサービス品質を維持するには、トラブルへの対処も効率的にしなくてはならないため、インシデント管理の業務が必要とされています。
そもそもインシデントとは
インシデントとは、直訳すると「出来事」「(小さな)事件」という意味です。
「重大事件に発展する可能性のある異変」というような、被害が拡大せぬよう迅速な対処が求められます。
たとえば、組織のIT全般を扱うサポートデスクなら、「システム障害」「サービスレベルの低下」「セキュリティ事案」など守備範囲が広くなりますが、特定の業務に特化した機器やシステムのヘルプデスクであれば、「仕様照会」や「操作案内」などの利用サポートが含まれるケースも。
このように、IT分野においては「システム異常」を指すことが多いですが、対応チームや担当範囲によって、対応するインシデント内容は変わります。
インシデント管理と問題管理の違い
インシデント管理には再発防止や改善策の実施が含まれると思う方もいるかもしれません。
ですが、それは「問題管理」という別の業務になります。
インシデント管理の対応とその知見から一歩進んで、「IT管理をブラッシュアップする」のが問題管理です。
問題管理はインシデントから問題を抽出・発見して、根本原因の特定と対策を実施し、同様なインシデントの再発防止、またサービス品質の安定や改良につなげます。
インシデント管理は起こったトラブルをひとまず解消して、ユーザーの利用継続をかなえる応急処置であり、それ以上踏み込むことはありません。
プリンタが故障したら代替手段を用意し、ユーザーの業務を滞らせないのがインシデント管理、故障の原因特定と再発防止策によりサービス品質を揺るぎないものにするのが問題解決です。
インシデント管理のフロー
インシデント管理のフローはおおむね以下のとおりです。
- インシデントの検出・受付・起票
- インシデントの分類と優先順位
- インシデントの解消
- クローズ
それぞれについて、次に詳しく説明します。
インシデントの検出・受付・起票
インシデント管理の開始は、ユーザーの利用を妨げる事象の検出です。
主に以下により認識されます。
- ユーザーからの連絡
- システムアラート
システム利用を妨げる何らかの事象がユーザーから寄せられたら受付します。
その次に、今後の対応に活用したり、問題管理の資料とするため、直ちに記録を開始します。
インシデントの分類と対応策の決定
対応方針を決めるため、起こったインシデントを分類し、具体的な対応にあたって、対応優先度を設定して、適切な担当に対応を割り当てます。
インシデントの分類は以下に基づいて行割れることが多いです。
- インシデントの種類
- 想定される影響の対象と範囲
- 緊急度
インシデントの種類は「障害回復要求」「サービス要求」の2つに大別されます。
前者で代表的なのはシステムトラブル、後者はパスワード再発行などです。
インシデントの現状と影響を把握し、緊急度を決定、対応方法の決定に移ります。
具体的な対応にあたり、次を決定します。
- 対応方法と手段
- 解決にかかる時間と工数
- 担当者
インシデントに対し、ナレッジの事例を参照して、容易に解決策が見つかる場合もあるでしょう。
高度な専門対応が必要とされる場合はベンダーやSEにエスカレーションし、調整や進捗管理を行います。
インシデント解消と進捗管理
インシデント対応は、ユーザーからの連絡や、検知による通知を受けた部署で対処することもあれば、適切な対処ができる組織に対応を依頼する場合もあります。
具体的な対応として
- サポート部門で対応
- エスカレーション
- クローズ
の3つがあります。
それぞれ具体的に見てみましょう。
サポート部門で対応
照会や問い合わせなど対応手順の決まっているもの、インシデント内容から容易に解決可能なものは一次対応チームで対処します。
過去に発生が確認された既知の問題ならば、ナレッジベースを活用し、早期解決に努めます。
エスカレーション
エスカレーションは「上司に相談して判断を仰ぐ」という意味です。
解決に高度な専門性が必要とするものや、サービスレベルの基準を大きく逸脱するインシデントの際、一次対応チームから担当エンジニアやベンダー、管理責任者に引き継いだり、連携しつつ対応します。
クローズ
インシデントが解決したら、ユーザーや関係者にすみやかに報告します。
解決後の経過観察や追加フォローが必要な場合、完了するまで対応を継続します。
そして、これまでの経過と対応履歴を記録にとどめ、必要であればナレッジベース等に追加し、今後の業務に活用できるようにしましょう。
インシデントを無事解決し、事象の再発や対応再開の必要もなくなればクローズとなり記録も終了となります。
その後、再発防止策や本質的な解決策の策定が必要とされる場合、別途問題管理のプロセスに引き継いで提供品質の向上に努めましょう。
また、こうしたインシデント対応のフローを一括で管理していただける「インシデント管理表」を制作いたしました。 弊社情報セキュリティコンサルタントがISMSの規格に基づいて作成いたしましたので、確実にインシデント管理を施していただけます。
無料でダウンロードできますので、貴社のインシデント発生時にお役立てください。
インシデント管理のメリット
インシデント管理を行うメリットは以下の2つです。
- IT運用の効率化
- サービス品質の向上
インシデント管理によるナレッジ共有で、サポート担当が迅速かつ正確にユーザー対応と対処ができるようになります。
また管理責任者が問題管理を行いやすくなり、システムの運営管理力を向上させられます。
さらにインシデントを分析し、対策の立案やシステム構築に生かせば、サービス品質を高めていくこともできるでしょう。ひいてはユーザーの満足度も上がるに違いありません。
このように、インシデント管理はITシステムを統括する管理者とユーザーの双方がメリットを享受できます。
なお、専任のユーザーサポートに日常的なインシデント管理を任せれば、その他の関係者は重大または頻発するインシデントの分析と対策に注力できます。
その結果、システム運営の効率も最大化できることでしょう。
インシデント管理の問題点
運用管理の効率化のためにも、インシデント管理の業務プロセスを設定することが望ましいですが、次の問題点もあります。
- ナレッジベースのあいまいな運用
- その場しのぎにすぎないことも
インシデント管理を効率化するにはナレッジベースの整備と適切な運用が必須です。
システム規模やユーザー数、ニーズにより、サポート担当は専任でも他業務との兼任でもよいでしょう。
しかし、管理ツールを単なる記録ツールとして扱うと有用なナレッジとならず、インシデント対応が後手に回りかねません。
効率的な運用のためにも、対応方法や結果を適切に記録し、情報共有・参照しやすいナレッジを整備していきましょう。
インシデント管理は可用性の維持を至上命題としているので、一時的なその場しのぎの解決策でも良しとされます。
そのため、同じ事象の発生が何度も繰り返される可能性があります。
インシデント管理で解決して終わりではなく、真の効率化のため、サービス品質向上のために定期的な分析と問題管理が必要です。
インシデント管理の後続のプロセス
ITILにおけるインシデント管理とは「早急な復旧対応」であり、根本原因の特定は求められません。
そのため、同じインシデントが発生する可能性は残ってしまいます。
本来であれば容易に対応できる問い合わせまで、エスカレーションして専門の人材が対応するとなれば、特定の部署や人物に負荷かかり、重要なインシデントの早期解決や、対応の品質維持に悪影響をおよぼしてしまいます。
それを解消するには、インシデント管理の後続のプロセス(過程)が重要になります。
ナレッジベース(知識ベース)の作成
一次対応の効率化、対応における個人差の解消をするために、ノウハウを蓄積して一次対応担当者向けのナレッジベースを作成する事が必要です。
これにより、容易な問題によるエスカレーションを防ぎ、属人化の防止に繋がります。
オペレーションルールを定義しておく
一次対応で解決できないインシデントの場合は、エスカレーションを行ないますが、その際、提供しているサービス内容が多岐にわたる場合は、複数存在する部署の中から適切な部門へ引き継がなければなりません。
スムーズな対応ができなければ、大幅な時間ロス、サービス品質の低下、顧客離れなどの損失が発生するリスクがあります。
このような事態を防ぐためにも、オペレーションルールの周知を徹底しましょう。
問題管理と変更管理を実施
「問題管理」とは、繰り返しになりますが「インシデント」の原因を分析して突き止め、再発を防止するプロセスです。
「変更管理」とは、変更によるサービスの中断を最小限に抑えながら、変更をスムーズに実施できるよう管理することです。
どちらも、ユーザーにとって信頼できるサービスを提供するにあたり、非常に重要な取り組みと言えるでしょう。 インシデント管理で不足する要素は問題管理で補いつつ、それにともなう影響を変更管理で制御しましょう。
まとめ
インシデント管理は、システムトラブルを解消しユーザーの業務継続を支援する業務です。
効率的なインシデント対応にはナレッジの整備と運用、技術者やベンダーとの連携がカギになるので、問題管理と変更管理も忘れずにあわせて実施しましょう。
弊社では、インシデント管理を適切な手順で効率的・効果的に行っていただくために、インシデント管理台帳をご用意いたしました。 インシデントの基本情報から発生原因・対応策・再発防止策に至るまで網羅的に活用いただけます。
無料でダウンロードできるので、インシデント管理にぜひお役立てください。