システムトラブルに迅速対応!インシデント管理の基本と進め方

この記事は約6分で読めます。

情シスのサポート部門にはユーザーからITシステムに関するトラブルや利用に関する相談が寄せられます。迅速な対応が可能なのは「インシデント管理」をしているからです。

今回はシステムトラブルに効率的に対応するインシデント管理の基本を解説します。

インシデント管理とは

インシデント管理とは、ITシステムの正常な利用を妨げる「インシデント」の対応管理です。つまり、システムが利用できない状況が生じたら、すみやかに解決・復旧することを指します。ITの運用管理において、インシデント管理はシステムの可用性を維持する一つの手段として用いられています。

高いサービス品質を維持するには、トラブルへの対処も効率的にしなくてはなりません。そのためにインシデント管理の業務が必要とされています。

インシデントとは

インシデント(incident)とは、直訳すると「出来事」「(小さな)事件」という意味です。真意としては「重大事件に発展する可能性のある異変」のことで、被害が拡大せぬよう迅速な対処が求められます。IT分野においては「システム異常」を指すことが多く、稼働停止や操作エラーなどさまざまな状態があります。

ただし、対応チームや担当範囲によって、対応するインシデント内容は変わります。たとえば組織のIT全般を扱うサポートデスクなら、システム障害やサービスレベルの低下、セキュリティ事案など守備範囲が広くなります。また特定の業務に特化した機器やシステムのヘルプデスクであれば、仕様照会や操作案内などの利用サポートが含まれることがあります。

インシデント管理と問題管理の違い

インシデント管理には再発防止改善策の実施が当然含まれると思う方もいるかもしれません。しかし、それは問題管理という別の業務になります。

インシデント管理の対応とその知見から一歩進んで、IT管理をブラッシュアップするのが問題管理です。問題管理はインシデントから問題を抽出・発見して、根本原因の特定と対策を実施し、同様なインシデントの再発防止、またサービス品質の安定や改良につなげます。

インシデント管理は起こったトラブルをひとまず解消して、ユーザーの利用継続をかなえる処置をするものです。したがって応急処置や一時的な解決案も可とされます。プリンタが故障したら代替手段を用意し、ユーザーの業務を滞らせないのがインシデント管理、故障の原因特定と再発防止策によりサービス品質を揺るぎないものにするのが問題解決です。

インシデント管理のフロー

インシデント管理のフローはおおむね以下のとおりです。

  • インシデントの検出・受付・起票
  • インシデントの分類と優先順位
  • インシデントの解消
  • クローズ

それぞれについて、次に詳しく説明します。

インシデントの検出・受付・起票

インシデント管理の開始は、ユーザーの利用を妨げる事象の検出です。主に以下により認識されます。

  • ユーザーからの連絡
  • システムアラート

システム利用を妨げる何らかの事象がユーザーから寄せられたら受付します。
次いで、今後の対応に活用したり、問題管理の資料とするため、直ちに記録を開始します。

インシデントの分類と対応策の決定

対応方針を決めるため、起こったインシデントを分類します。具体的な対応にあたって、対応優先度を設定し、適切な担当に対応を割り当てます。

インシデントの分類は以下に基づいて行います。

  • インシデントの種類
  • 想定される影響の対象と範囲
  • 緊急度

インシデントの種類は「障害回復要求」「サービス要求」の2つに大別されます。前者で代表的なのはシステムトラブル、後者はパスワード再発行などです。インシデントの現状と影響を把握し、緊急度を決定、対応方法の決定に移ります。

具体的な対応にあたり、次を決定します。

  • 対応方法と手段
  • 解決にかかる時間と工数
  • 担当者

インシデントに対し、ナレッジの事例を参照して、すぐに解決策がとれるケースもあります。高度な専門対応が必要とされる場合はベンダーやSEにエスカレーションし、調整や進捗管理を行います。

インシデント解消と進捗管理

インシデント対応は、ユーザーからの連絡や検知による通知を受けた部署で対処することもあれば、適切な対処ができる組織に対応を依頼することもあります。またインシデントの経過状況や対応実績、顧客への報告状況を管理します。

サポート部門で対応

照会や問い合わせなど対応手順の決まっているもの、インシデント内容から容易に解決可能なものは一次対応チームで対処します。過去に発生が確認された既知の問題ならば、ナレッジベースを活用し、早期解決に努めます。

エスカレーション

解決に高度な専門性が必要とするものや、サービスレベルの基準を大きく逸脱するインシデントは、一次対応チームから担当エンジニアやベンダー、管理責任者に引き継いだり、連携しつつ対応します。

クローズ 

インシデントが解決したら、ユーザーや関係者にすみやかに報告します。
解決後の経過観察や追加フォローが必要な場合、完了するまで対応を継続します。

そして、これまでの経過と対応履歴を記録にとどめ、必要であればナレッジベース等に追加し、今後の業務に活用できるようにします。インシデントを無事解決し、事象の再発や対応再開の必要もなくなればクローズとなり記録も終了します。

その後、再発防止策や本質的な解決策の策定が必要とされる場合、別途問題管理のプロセスに引き継いで提供品質の向上に努めます。

インシデント管理のメリット

インシデント管理を行うメリットは以下の2つです。

  • IT運用の効率化
  • サービス品質の向上

インシデント管理によるナレッジ共有で、サポート担当が迅速かつ正確にユーザー対応と対処ができるようになります。また管理責任者が問題管理を行いやすくなり、システムの運営管理力を向上させられます。さらにインシデントを分析し、対策の立案やシステム構築に生かせば、サービス品質を高めていくこともできるでしょう。ひいてはユーザーの満足度も上がるに違いありません。

このように、インシデント管理はITシステムを統括する管理者とユーザーの双方がメリットを享受できます。なお、専任のユーザーサポートに日常的なインシデント管理を任せれば、その他の関係者は重大または頻発するインシデントの分析と対策に注力できます。その結果、システム運営の効率も最大化できることでしょう。

インシデント管理の問題点

運用管理の効率化のためにも、インシデント管理の業務プロセスを設定することが望ましいですが、次の問題点もあります。

  • ナレッジベースのあいまいな運用
  • その場しのぎにすぎないことも

インシデント管理を効率化するにはナレッジベースの整備と適切な運用が必須です。システム規模やユーザー数、ニーズにより、サポート担当は専任でも他業務との兼任でもよいでしょう。しかし、管理ツールを単なる記録ツールとして扱うと有用なナレッジとならず、インシデント対応が後手に回りかねません。効率的な運用のためにも、対応方法や結果を適切に記録し、情報共有・参照しやすいナレッジを整備していきましょう。

インシデント管理は可用性の維持を至上命題としているので、一時的なその場しのぎの解決策でも良しとされます。そのため、同じ事象の発生が何度も繰り返される可能性があります。インシデント管理で解決して終わりではなく、真の効率化のため、サービス品質向上のために定期的な分析と問題管理が必要です。

まとめ

インシデント管理はシステムトラブルを解消し、ユーザーの業務継続を支援する、いわば黒子です。効率的なインシデント対応にはナレッジの整備と運用、技術者やベンダーとの連携がカギになります。

適切なITサービスの提供のため、問題管理もあわせて実施しましょう。

セキュリティ対策をする 組織体制の構築
LRM株式会社 画像
この記事を書いた人
ISMSやPマーク取得支援・情報セキュリティツールの導入支援を行っている情報セキュリティコンサルティング会社。また、情報セキュリティ向上クラウド「Seculio」の運営しています。
セキュマガ | LRM株式会社が発信する情報セキュリティの専門マガジン
タイトルとURLをコピーしました