メインコンテンツへスキップ
エージェント主導のダッシュボード・チャート・アラートを使用して、接続されたすべてのクラウド環境の使用率・パフォーマンス・信頼性データをクエリします。コスト異常分析と支出トレンドはCost Analyticsにあります。

プロンプト構文

分析クエリの一般的な形式:
@agent #tool your query [time range]
コンポーネント説明
@agentクエリを実行するエージェント@alex(クラウドとコンピュート)・@tony(データベース)・@kai(Kubernetes)・@anna(予測と調整)
#tool出力形式#dashboard(ビジュアル)・#chart(インライン)・#report(エクスポート可能)・#alert(しきい値ルール)
time rangeオプション。デフォルトは7日last 7 dayslast 30 dayslast quartersince last quarter
完全な構文リファレンスはCloudThinker Languageを参照してください。

ダッシュボード

ダッシュボード表示内容エージェント
リソース使用率サービス・リージョン・アカウント別のCPU・メモリ・ストレージ・ネットワーク使用量Alex、Kai
Kubernetesワークロード効率名前空間別のポッドリソースリクエストvs実際の使用量Kai
アプリケーションパフォーマンスインフラ負荷と相関したAPIレスポンスタイムとエラーレートAlex
データベースパフォーマンスP50/P95/P99のクエリレイテンシ・スロークエリ・接続数Tony
クラスターヘルスCPUプレッシャー・OOMKillイベント・ノードステータスKai
キャパシティヘッドルームパフォーマンスへの影響前のリソースの余裕Alex、Anna
使用率トレンド選択した期間での改善または低下Alex

アラート

シグナル検出内容デフォルトしきい値
CPUプレッシャークラスター全体での持続的な高CPU設定可能な時間で>85%
メモリ増加リリースなしの継続的な増加(リークパターン)1時間あたり>10%
レイテンシ低下ベースラインを超えるP95レイテンシの上昇ベースラインの>2倍
OOMKillメモリ制限によるポッドの終了任意の発生
レプリケーション遅延データベースレプリカがプライマリより遅れている>30秒
すべてのしきい値は #alert プロンプトを使用して環境ごとに設定できます。

シグナルの解釈

パターン考えられる原因次のステップ
高使用率 + 正常なレイテンシ適切にサイズ設定されたワークロードリザーブドキャパシティを検討—@alexに確認
低使用率 + 高コストオーバープロビジョニングされたリソース@alexで適切なサイズに変更
高レイテンシ + 正常な使用率アプリケーションまたはデータベースのボトルネック@tonyに確認
使用率スパイク + OOMKillリソース制限の設定ミス@kaiに確認
トラフィック変化なしのコストスパイク設定ドリフトまたは孤立リソース@alexに確認またはCloudKeepersの調査結果を確認

使用例

使用率ダッシュボード:
@alex #dashboard resource utilization across all accounts last 7 days
@kai #dashboard pod resource requests vs actual usage by namespace
パフォーマンスダッシュボード:
@tony #dashboard query latency P50/P95/P99 over last 30 days
@kai #dashboard cluster CPU pressure and OOMKill events by namespace
アラートの設定:
@tony #alert when P95 query latency exceeds 500ms for 5 consecutive minutes
@kai #alert on OOMKilled events or nodes with more than 90% memory pressure
トレンドと予測:
@anna forecast infrastructure needs for 2x traffic growth
@alex show improvement in resource utilization since last quarter

関連ドキュメント

CloudKeepers

インフラを継続的に監視して調査結果を表面化するKeeperをセットアップする

Cost Analytics

接続されたアカウントの支出パターンと異常を分析する

Assessment

インフラの健全性をベースライン化するWell-Architectedアセスメントを実行する

Topology

分析シグナルとインフラ依存グラフを相関させる