メインコンテンツへスキップ
Topology Explorerはクラウドインフラとサービスの関係をインタラクティブなマップとして表示します。エージェントによるライブクラウドAPIからのマップ検出、Infrastructure as Codeからのインポート、または手動構築が可能です。
Topology Explorer

トポロジーマップの構築

接続されたクラウドアカウントから直接リソースと関係を検出するようエージェントに依頼します。インフラが変更されるとマップが同期されます。
@alex discover and map the infrastructure topology for the production AWS account
@kai map Kubernetes service dependencies in the main cluster
検出には、マッピングしたい各プロバイダーのアクティブな接続が必要です。

リソースタイプ

Topology Explorerはすべての主要なクラウドリソースタイプをサポートしています:
カテゴリリソース
コンピュートEC2、Lambda、ECS、EKS、VM、Cloud Run
ネットワーキングVPC、ロードバランサー、CloudFront、API Gateway
データベースRDS、Aurora、DynamoDB、Cloud SQL
ストレージS3、EFS、EBS、Cloud Storage
セキュリティIAMロール、セキュリティグループ、ACM証明書
Kubernetesクラスター、デプロイメント、サービス、ポッド

ビュー・フィルター・エクスポート

コントロール機能
Load View ドロップダウン保存済みトポロジービューを開く
検索・フィルターパネル名前またはIDでリソースを検索、タイプ・タグ・メタデータでフィルタリング、カテゴリの表示/非表示
Synced インジケータートポロジーがインフラから最後に更新された時刻を表示
エクスポートビューをPNG/SVG・PDF・JSONとして保存、または共有リンクを生成

エージェントによるトポロジーの活用

すべてのエージェントがトポロジーマップを読み取り、依存パスを推論できます:
エージェントトポロジーの活用
Alexコストへの影響の可視化、リソース最適化パス
Oliverセキュリティ露出のマッピング、コンプライアンスの可視化
Tonyデータベース依存チェーン、パフォーマンスボトルネック
Kaiサービスメッシュの可視化、ポッドの関係
Annaクロスサービスのインシデント調整、アーキテクチャレビュー

トポロジー主導のRCA

ほとんどのインシデントはアラートを発したサービスではなく、依存関係で発生するため、トポロジーはRoot Cause分析を加速します。以下は実例です。 アラート: チェックアウトの成功率が60%に低下。チェックアウトのログには断続的なタイムアウトが見られますが、決済サービス・データベース・キャッシュはすべて正常と報告しています。
  1. ログからではなく、アラートから始めます。健全性オーバーレイを付けてアラートが発したサービスをマップの中心に:
    @alex show the topology centered on checkout-service with health status overlaid
    
    サービスの依存関係を示すトポロジー
  2. 上流を追跡します。マップはチェックアウトサービス → 決済ゲートウェイ → 外部決済APIの依存チェーンを示し、外部APIノードが低下と表示されています。
  3. メトリクスで確認し、最近の変更を排除してから対応します:
    @alex overlay latency and error-rate metrics on this topology view
    @alex show topology changes in the last 24 hours
    
    Alexはゲートウェイから外部APIへのエッジにタイムアウトが集中していることを示し、決済パスに最近のデプロイがないことを確認—サードパーティプロバイダーが原因と特定します。
  4. 解決と記録。バックアップ決済プロバイダーにフェイルオーバーし、インシデントレコードとポストモーテム用にトポロジースナップショットをエクスポートします。

カスケード障害の読み取り

複数のサービスが同時に障害を起こした場合、トポロジーのタイムラインビューは、各チームが独自のサービスを調査する代わりに、単一ビューで起源と伝播順序を示します。このカスケードでは、すべての下流の障害が1つの期限切れSSL証明書に遡ります:
時刻サービスステータス原因
10:00:00認証サービス障害SSL証明書の期限切れ
10:00:05ユーザーサービス障害トークン検証不可
10:00:08注文サービス障害認証依存
10:00:10決済サービス障害認証依存
10:00:15全サービス障害カスケード完了
インシデント前にトポロジーを構築し、ヘルスデータソースを接続してください。事前に構築・同期されたマップがあれば、最初のステップが数分ではなく数秒で完了します。

活用例

  • @alex show downstream dependencies of payment-service — リスクのある変更前に影響範囲を確認する
  • @oliver map all connections from instance i-0abc123 — 調査中のセキュリティ露出のスコープを確認する
  • @tony map every service connecting to the production database — 接続枯渇の原因を特定する
  • @kai show service dependencies and single points of failure in the cluster — Kubernetesの信頼性を強化する
  • @alex compare the production topology with the DR region and list missing resources — ディザスタリカバリのカバレッジを検証する

関連ドキュメント

Resources

検出済みのすべてのインフラリソースを確認する

Root cause analysis

エージェント主導のRCAをインシデントに対して実行する

Assessment

インフラアセスメントを実行する