メインコンテンツへスキップ
すべてのインシデントがモニタリングプラットフォームから発生するわけではありません。問題を直接観察した場合、顧客からの報告を受けた場合、または Webhook を設定する前に RCA ワークフローをテストしたい場合、手動によるインシデント作成で CloudThinker の AI 搭載調査機能に即座にアクセスできます。手動登録により、自動アラートで検出されたものか人間の観察によるものかに関わらず、すべての問題が構造化されたトラッキングと体系的な根本原因分析を受けることができます。

インシデントの作成

手動インシデント作成フォーム:タイトル、説明、重要度、影響サービスのフィールド

手動インシデント作成フォーム

必須フィールド

タイトル
  • インシデントの簡潔な要約(例:「本番環境の API Gateway 503 エラー」)
  • インシデントリストと通知に表示されます
  • AI エージェントがインシデントの範囲を把握するために使用します
説明
  • 発生している状況に関する詳細なコンテキスト
  • 観察可能な症状と顧客への影響
  • 判明している場合はイベントのタイムライン
  • すでに試みたトラブルシューティング手順
  • @ を使って特定のエージェント(例:@alex@tony)にメンションして調査を誘導できます
添付ファイル(任意)
  • 説明フィールド横の 「添付」 ボタンをクリックするか、フォームにファイルを直接ドラッグ&ドロップします
  • クリップボードから画像を貼り付けることもできます
  • スクリーンショット、ログファイル、エラーエクスポート、その他の支持エビデンスを添付できます
  • 制限:最大 5 ファイル、各 25MB
  • 添付ファイルは調査中の AI エージェントが利用でき、根本原因の特定を迅速化するための追加コンテキストを提供します
重要度
  • Critical:完全なサービス停止、データ損失、セキュリティ侵害
  • High:主要な機能が低下し、顧客への重大な影響がある
  • Medium:一部の機能に影響、回避策あり
  • Low:軽微な問題、顧客への影響は最小限
影響サービス(任意)
  • トポロジーマップから選択します
  • RCA エージェントが調査範囲を優先順位付けするのに役立ちます
  • どの専門エージェントを起動するかを決定します
  • 調査後に追加の影響が判明した場合は更新できます

次に何が起こるか

保存後、CloudThinker は自動的に以下を実行します。
  1. RCA タスクのキューイング:AI 調査が数秒以内にバックグラウンドで開始されます
  2. エージェントの起動:専門エージェント(AlexTonyKaiOliver)が影響サービスに基づいてインフラを分析します
  3. タイムラインの構築:仮説追跡付きで調査の所見がリアルタイムでログに記録されます
  4. 根本原因の特定:構造化されたエビデンスチェーンを使った仮説駆動型分析
  5. 修復策の提案:影響と緊急度で優先順位付けされたアクショナブルなステップ
根本原因分析タイムラインで進捗を追跡できます。エージェントがコンテキストを収集し、仮説を検証し、エビデンスチェーンを構築する様子を確認できます。

手動作成と Webhook 作成の使い分け

シナリオ推奨方法
モニタリングプラットフォームのアラートWebhook インテグレーション
顧客からの報告手動登録
RCA ワークフローのテスト手動登録
アドホック調査手動登録
プロアクティブなヘルスチェック手動登録
観察された機能低下(アラート前)手動登録

次のステップ

根本原因分析

AI エージェントがインシデントを調査しエビデンスチェーンを構築する仕組みを理解する

Webhook インテグレーション

PagerDuty・Datadog・Prometheus などからインシデント作成を自動化