4.1 モノエージェントではなくマルチエージェントを選ぶ理由
本章で説明する内容と、そうでない内容について一言述べておきます。以下のアーキテクチャ — 単一オーケストレーター、名前付きドメインスペシャリスト、2層構造の検知・解決ループ、トークン化バウンダリー — は、特定のベンダーの製品設計ではなく、プロダクション環境のデプロイが収束しつつあるパターンです。この収束は独立した実践の中に観察できます。Anthropicが公開したマルチエージェント研究システムは同じオーケストレーターとワーカーの構造を採用しており、MicrosoftとAWSのオペレーションエージェントは、エージェントごとの最小権限クレデンシャルを持つ制御レイヤーの下に協調するスペシャリストを配置することで構築されています。本書の出版元であるCloudThinkerというプラットフォームがこのパターンをどのように実装しているかは別の問題であり、§10.3で開示・解説されています。本章は、採用するプラットフォームに関わらず成立する、この分野が落ち着きつつある形について論じています。 この分野は、単一の汎用エージェントから、スペシャリストの協調チームへと明確に移行しました。Gartnerは、2024年Q1から2025年Q2にかけてマルチエージェントシステムへの問い合わせが1,445%急増したと報告しており、このカテゴリーで最も急峻な需要シグナルとなっています。その理由は流行ではなく、実用的なものです。- 深さは広さに勝る。 キュレートされたK8sツール、プロンプト、学習済みパターンを持つKubernetesスペシャリストは、K8s問題において汎用エージェントを上回ります。これは人間チームが専門化するのと同じ理由です。
- ブラスト半径の制限。 各スペシャリストは、そのドメインが必要とするクレデンシャルのみを保持します。データベースエージェントはセキュリティグループを変更できず、コストエージェントはテーブルを削除できません。
- 独立した進化。 スペシャリストはマイクロサービスと同じ教訓を適用して、独立してアップグレード、評価、ロールバックできます。
- 監査可能なハンドオフ。 エージェント間の委任により、誰が何を決定したかの明示的な証跡が残ります。これはモノリシックな推論では隠蔽されてしまいます。
4.2 リファレンスアーキテクチャ
プロダクションのエージェント運用プラットフォームには5つのレイヤーがあります。- オーケストレーター(SuperAgent)。 横断的な推論を担う調整エージェントです。ゴールとインシデントを受け取り、分解してスペシャリストに作業をルーティングし、その結果を統合してエスカレーションを管理し、運用チームとの対話を担います。すべてがこれを通じて流れます。スペシャリストはオーケストレーターと競合するのではなく、それを拡張します。
- スペシャリストエージェント。 ドメインエキスパートです。通常はクラウドエンジニアリング、セキュリティ、データベース、Kubernetesを担当し、それぞれがキュレートされたツール、ドメイン知識、スコープされたクレデンシャルを持ちます。組織は自社のニーズに応じてコスト最適化、アプリケーションパフォーマンス、内部プラットフォームなどのカスタムスペシャリストを追加します。
- 運用ループ。 すべての作業が流れる規律あるパイプラインです:Detect → Analyze → Resolve → Validate(DARV)。検知はシグナルを取り込み、分析は証拠に基づいた根本原因仮説を生成し、解決はポリシーに従って修正を計画・実行し、検証は結果を確認して学習にフィードバックします。このValidateステージが、エージェント運用を単なる自動化と区別するものです — システムは自身の作業を確認します。
- ツール・インテグレーションレイヤー。 クラウドAPI、オブザーバビリティプラットフォーム、CI/CD、ITSM、Slack・Teamsなどのコミュニケーションチャンネルをエージェントごとの最小権限クレデンシャルで公開するMCPサーバーとネイティブインテグレーション。
- コンテキスト・メモリレイヤー。 トポロジーグラフ、ランブックライブラリー、過去のインシデントメモリ、組織の慣行、環境メタデータ。ここでエージェントは複利的に成長します。解決されたインシデントが積み重なるほど、次のインシデントへの対応が速くなります。
図4 — リファレンスアーキテクチャ:1つのオーケストレーター、スペシャリストエージェント、Detect→Analyze→Resolve→Validateループ、ツール、メモリ。
4.3 ディープレスポンスパターン
単純なエージェント設計は、アラートごとに1回のモデル呼び出しを実行し、プロダクションスケールで破綻します。成熟したプラットフォームは2つのエンジンを分離します。軽量で常時稼働するシグナル監視エンジン(「Pulse」)がシグナルを低コストで継続的に監視し、重量級のリゾルバーエンジンはPulseが調査に値するものを検知した場合にのみ、完全なマルチステップ推論を起動します。この2層設計は、24時間365日のエージェントカバレッジを経済的に実現するものです — フロンティアモデルの推論はそれが必要な瞬間のために予約され、安価な知覚が常時実行されます。エージェントコスト最適化は2026年において、マイクロサービス時代にクラウドコスト最適化が不可欠になったのと全く同じように、ファーストクラスのアーキテクチャ上の関心事となっています。4.4 パイプライン内のデータ保護
規制を受ける業界では、テレメトリーは取り扱い注意のデータです。ログとクエリは顧客のPII、クレデンシャル、アカウントデータを漏洩させます。新興のベストプラクティスはトークン化バウンダリーです — PIIを認識するレイヤーが、データがモデルに到達する前に機密情報を検出して可逆的なトークンに置換し、アクションが実際の値を必要とする場合にのみ顧客のトラストバウンダリー内でデトークン化を行います。セルフホストまたはBYOC(Bring Your Own Cloud)デプロイメントと組み合わせることで、銀行や金融機関はテレメトリーがペリメーターを離れることなくエージェント運用を採用できます。第6章では、データレジデンシーと管理に関する完全な問題 — デプロイメントモデル、データ主権、ベンダーへの質問 — を詳しく扱います。アーキテクチャチェックリスト
- ✓ 横断的な推論と人間へのエスカレーションを担う1つのオーケストレーター
- ✓ ドメインごとの最小権限クレデンシャルを持つスペシャリスト
- ✓ 検証を組み込んだ明示的なDetect → Analyze → Resolve → Validateループ
- ✓ モデルコストを管理するための2層構造の検知・解決
- ✓ モデル境界前のPIIトークン化;規制対象ワークロードへのBYOC/セルフホストオプション
- ✓ システムがコールドスタートではなく複利的に成長するための永続メモリ