メインコンテンツへスキップ
Pulse は 3 つのソースファミリーからシグナルを取得します。AWS サービスポーラー、チャットプラットフォーム(Slack および Teams)、サードパーティのモニタリング Webhook です。いずれも 「サブスクリプションを管理」 ページで設定します。ソースを接続すると、Pulse はすべてのイベントを重複排除・分類し、アクショナブルな基準を超えたクラスターはエージェントが根本原因を調査するインシデントにエスカレーションされます。

前提条件

  • CloudThinker ワークスペース — Pulse が初めての方は先に仕組みの解説をお読みください
  • ポーリングしたいサービスの読み取り権限を持つ有効な AWS 接続
  • チャットチャンネルのシグナルが必要な場合は、Slack または Teams に CloudThinker ボットをインストール済みであること
  • サードパーティシグナルが必要な場合は、アウトバウンド Webhook をサポートするモニタリングツール

モニタリングをインシデントに接続する

ソースを接続し、シグナルが届くことを確認し、アクショナブルなクラスターをインシデントにエスカレーションするエンドツーエンドのフローです。
1

Pulse を開く

ワークスペースの Pulse に移動し、「サブスクリプションを管理」 をクリックします。3 つのソースファミリーとその現在の状態が一覧表示されます。
2

少なくとも 1 つのソースを追加する

AWS ポーラーを有効化するか、チャットチャンネルをサブスクライブするか、モニタリング Webhook を CloudThinker に向けます。以下の 3 つの手順でそれぞれのパスを説明します。
3

シグナルが届くことを確認する

モニタリングツールからテストアラートを送信するか、次のポーリングサイクルを待ちます。成功の確認: 新しいシグナルがカテゴリー・重要度・1 行の要約付きで Pulse フィードに表示されます。
4

クラスターをインシデントにエスカレーションする

Pulse は Critical または High の重要度シグナルを持つクラスター、または AI がアクショナブルと判断したシグナルを自動エスカレーションします。それ以外の場合はクラスターの 「エスカレーション」 をクリックします。成功の確認: リンクされたインシデントが作成され、クラスターの完全なシグナル履歴を開始コンテキストとして根本原因分析が始まります。

AWS ポーリング

AWS ポーリングにより、Pulse はスケジュールに従って AWS アカウントから直接イベントを取得します。Webhook の設定は不要です。各ソースは接続ごとに有効化します。
ソースPulse が収集する内容頻度
CloudTrailAPI 呼び出し監査ログ — 誰が、いつ、どのリソースに対して何をしたか5 分ごと
AWS Healthアカウントまたはリージョンに影響するサービスヘルスイベント5 分ごと
Cost AnomalyAWS Cost Anomaly Detector が検出した支出急増6 時間ごと
GuardDuty脅威インテリジェンスの検出結果 — 侵害されたインスタンス、疑わしい動作定期的
ConfigConfig ルールに対するリソース設定ドリフト定期的
Access AnalyzerIAM および S3 のアクセス検出結果 — 過度に許可されたリソースや公開リソース定期的

ポーラーを有効化する

1

ポーリング設定を開く

Pulse で 「サブスクリプションを管理」 をクリックし、「AWS ポーリング」 セクションに移動します。接続済みの AWS アカウントと現在のポーリング状態が表示されます。
2

まず検証する

ソースの横にある 「検証」 をクリックします。Pulse がドライランを実行し、認証情報に必要な読み取り権限があることを確認します。成功の確認: チェックマーク ✓ が表示されれば準備完了。エラーコード(例:AccessDenied)が表示された場合は不足している権限が示されます。
3

有効化する

ソースのトグルをオンにします。Pulse はすぐにポーリングを開始します。
ポーラーが 5 回連続で失敗すると、Pulse は自動的に一時停止しエラーコードを表示します。再開するには、問題を修正し、再検証してからトグルを再度有効にします。

Slack および Teams サブスクリプション

CloudThinker ボットがチャンネルに存在する場合、そのチャンネルのメッセージが Pulse シグナルになります。アラートボットの投稿、インシデント告知、オンコールのやり取りなどが、インフライベントと並んで分類されます。
サブスクリプション作成ダイアログ:プラットフォームドロップダウンで Slack を選択、チャンネル検索フィールド、ボット招待の案内、Enabled トグル

プラットフォームを選択し、チャンネルを選び、ボットを招待して保存

1

プラットフォームを選択する

Slack または Microsoft Teams を選択します。
2

チャンネルを選ぶ

モニタリングしたいチャンネルを検索します。
3

ボットを招待する(Slack のみ)

対象チャンネルで /invite @CloudThinker を実行します。Slack はチャンネルメンバーであるアプリにのみメッセージを配信します。
4

保存する

Enabled はデフォルトでオンになっています。「サブスクリプションを作成」 をクリックします。
サブスクリプションは個別にオン・オフを切り替えられます。設定を失わずにメンテナンスウィンドウ中にチャンネルをミュートする場合に便利です。

チャンネルタイプ

タイプ最適な用途
Alert(アラート)自動アラートボット専用のチャンネル
Communication(コミュニケーション)人間の議論用チャンネル — インシデントチャット、引き継ぎ
Mixed(混合)(デフォルト)自動アラートと人間のメッセージの両方を含むチャンネル

サードパーティ Webhook

アウトバウンド Webhook をサポートするモニタリングツールであれば、Pulse にシグナルを送信できます。Datadog、Grafana、PagerDuty などは組み込みのフィールドマッピングを備えています。
1

Webhook エンドポイントを作成する

CloudThinker の Webhooks に移動し、エンドポイントを作成します。完全な設定手順は Webhooks を参照してください。
2

モニタリングツールを接続先に向ける

生成された URL をツールの Webhook または通知設定に貼り付けます。プラットフォーム固有の手順、認証オプション、フィールドマッピングは Webhook インテグレーション にあります。
3

テストアラートを送信する

モニタリングツールのテスト機能を使用します。成功の確認: アラートが数秒以内に Pulse フィードにシグナルとして表示されます。

シグナルカテゴリー

すべてのシグナルは、ソースに関わらず 8 つのカテゴリーのいずれかに割り当てられます。
カテゴリー
Compute(コンピュート)EC2 ステータス、Lambda タイムアウト、ECS 障害、コンテナの再起動
Network(ネットワーク)NAT ゲートウェイの異常、CloudFront の低下、VPC の変更
Security(セキュリティ)GuardDuty 検出結果、IAM 変更、S3 パブリックアクセス、WAF トリガー
Cost(コスト)コスト異常、アイドルリソース、Savings Plan の減少、RI 期限切れ
Data(データ)RDS 接続の問題、S3 オペレーション、データベースイベント
Deploy(デプロイ)CodeDeploy、ECS ロールアウト、CloudFormation スタック変更
Communication(コミュニケーション)Slack および Teams のメッセージ、アラートボット通知
Unclassified(未分類)AI 分類器がカテゴリーを割り当てるまでのデフォルト

次のステップ

クラスター

クラスターのライフサイクルをトリアージ — Active から Routed、そして Resolved へ

Webhook インテグレーション

Datadog、Grafana、PagerDuty などのプラットフォーム固有セットアップ

根本原因分析

エージェントがエスカレーションされたインシデントを確信ある根本原因まで調査する仕組み

Pulse アナリティクス

ソース全体でノイズ削減とシグナルトレンドを計測