基本情報 平成26年度 春期 問58:マネジメント系に関する問題
システム障害の発生時に, オペレータが障害の発生を確実に認知できるのはどれか。
- aサーバルームに室内全体を見渡せるモニタカメラを設置して常時監視する。
- bシステムコンソールへ出力させるアラームなどのメッセージに連動して, 信号表 示灯を点灯する機能や報知器を鳴動する機能を設ける。正答
- c障害発生時にスナップショットダンプやメモリダンプを採取する機能を設ける。
- d毎日定時にファイルをフルバックアップする機能を設ける。
AI解説(初心者・標準・上級)
理解度に合わせて3レベルの解説を無料で読めます。
答えは b です。
障害が起きたとき、オペレータが確実に気づけるようにするには、画面メッセージだけだと見逃す可能性があります。
だから「ピカピカ光るランプ」や「ブザー音」のような、目立つ警報装置を組み合わせるのが一番確実。
👉 覚え方:「光・音で気づかせる」。
ほかの選択肢:a 監視カメラ(映像見てるとは限らない)/c メモリダンプ(事後解析用)/d バックアップ(復旧用)。どれも「気づかせる」機能ではない。
なぜこれが正解か
正解は b。システム障害をオペレータが確実に認知するには、画面表示だけでは不十分(注視していない、別作業中等で見逃す可能性)。信号表示灯(パトライト)や報知器(ブザー、音声アナウンス)を連動させることで、オペレータの視覚・聴覚に直接訴え、確実な気づきを実現する。
各選択肢の解説
- a モニタカメラ:常時注視している保証がない。映像から障害発生を判断するのも遅い。
- b コンソールメッセージ+表示灯+報知器:多重チャネルで確実な認知(正解)。
- c スナップショットダンプ/メモリダンプ:障害発生後の解析用で、認知手段ではない。
- d 定時フルバックアップ:データ保全用で、認知手段ではない。
覚え方・ひっかけ注意
「障害認知=視覚+聴覚の多重通知」。問題文の「確実に認知できる」が決定的キーワード。サーバ室では実際にパトライトや警告ブザーが運用されている。クラウド時代はメール・SMS・Slack・PagerDuty等の通知が代替・補完する。「障害認知」と「障害解析」「障害復旧」「障害予防」を区別: aは予防的・cは解析用・dは復旧用、bだけが認知用。
理論的背景
ITサービス運用の「インシデント管理プロセス」(ITIL v4のIncident Managementプラクティス)では、インシデント検知→記録→分類→優先度付け→診断→解決→クローズの流れを取る。検知段階で重要なのは:
1. 検知の確実性: 障害発生を100%認知する
2. 検知の即時性: 発生から検知までの遅延最小化(MTTD: Mean Time To Detect)
3. 検知の正確性: 偽陽性/偽陰性の最小化
多重通知(視覚+聴覚+モバイル等)は冗長性によって(1)を高め、自動連携(イベント駆動)で(2)を改善する。
実務での使われ方
現代のクラウド/SaaS時代の障害認知:
- APM(Application Performance Monitoring): New Relic、Datadog、AppDynamics、Dynatrace。アプリのレスポンスタイム・エラー率・スループットをリアルタイム監視
- ログ集約: Splunk、Elastic Stack(ELK)、Sumo Logic、Datadog Logs
- メトリクス監視: Prometheus + Grafana、CloudWatch、Azure Monitor
- トレーシング: Jaeger、Zipkin、AWS X-Ray、OpenTelemetry標準
- インシデント通知: PagerDuty、OpsGenie、VictorOps(Splunk On-Call)、Slack/Teams連携
アラート設計のベストプラクティス(Google SRE Book):
- 症状ベース通知(ユーザー影響)優先、原因ベース通知は補助
- SLO/SLI/SLAでアラート閾値設定(エラーバジェット)
- アラート疲れ防止: アラート集約・抑制、On-Call rotation、重要度別通知方法
- ランブック自動化: 検知→自動診断→自動修復(self-healing)
Kubernetes時代ではカオスエンジニアリング(Chaos Monkey、Litmus、Gremlin)で意図的に障害を発生させ、検知・対応の質を検証する手法も普及。
試験での位置づけ
FE/AP/SM(サービスマネージャ)/SC(情報処理安全確保支援士)で頻出。①インシデント管理、②監視設計、③SLA/SLO、④可用性指標(MTBF、MTTR、稼働率)、⑤運用自動化(ChatOps、AIOps)、⑥カオスエンジニアリング、が主要論点。本問は基礎的な障害認知の問題。
選択肢の発展補足
MTBF(平均故障間隔)・MTTR(平均修復時間)・MTTD(平均検知時間)・MTTA(平均応答時間)は運用品質指標。SREでは特にMTTR短縮が重視され、自動回復機構(Auto-healing、Auto-scaling、Multi-region failover)、Chaos Engineering、SLOベースのデプロイメント制御(SLO budget burndown)等で改善する。
AIOps(Artificial Intelligence for IT Operations)は機械学習で異常検知・原因推定・自動対応を実現する次世代運用。Moogsoft、BigPanda、Datadog Watchdogなどが商品化。生成AI時代では ChatGPT/Claude を運用支援に活用するChatOps高度化も進行(事象要約、対応手順生成、ポストモーテム作成支援)。古典的なパトライト+ブザーから、AI駆動の自動運用までの「障害認知の進化系譜」を把握することが現代の運用エンジニアの基礎力。
出典:IPA(情報処理推進機構)公式 基本情報技術者試験 平成26年度 春期 問58/ 公的機関配布資料につき出典明記の上引用。解説は合格ナビによる独自AI解説です。