第2章 · 自動化から自律へ

エージェント運用は40年の進化の第4世代だ。その系譜を理解することで、その力と前提条件の両方が明らかになる。

図2 — 運用の4世代。それぞれが前世代を吸収する。第4世代がループを閉じる。

2.1 運用の4世代

世代	時代	核心的なアイデア	限界
第1世代 · 手動＋スクリプト	1990年代〜2010年	人間が操作し、シェルスクリプトが繰り返し作業を処理する	すべてが人を待つ。属人的な知識
第2世代 · Infrastructure as Code	2010〜2018年	宣言的な望ましい状態、CI/CD パイプライン、構成管理	プロビジョニングを自動化するが、運用はしない。ドリフトとデイ2は依然として手動
第3世代 · AIOps	2017〜2024年	異常検出、イベント相関、ノイズ削減のための ML	検出と相関はするが、判断も行動もしない。「だから何?」のギャップ
第4世代 · エージェント運用	2024年〜	知覚し、推論し、行動し、検証するゴール指向のエージェント	信頼アーキテクチャ、ガバナンス、新しい運用モデルが必要

各世代は前の世代を置き換えるのではなく吸収した。エージェント運用は IaC の上で動作し（エージェントは変更をコードとして表現する）、AIOps スタイルのシグナルを消費し（相関されたイベントがエージェントへの入力となる）、依然としてスクリプトを生成する（エージェントが書いて実行する）。変わるのは、誰がループを閉じるかだ。

2.2 なぜ AIOps が不十分だったか

AIOps は評価されるべき点がある。イベント相関と重複排除は本当に機能し、インテリジェントな相関によって生のアラート量の80〜90%を削減できる。しかしカテゴリーは約束しすぎた。Gartner は2025年に「AIOps プラットフォーム」市場を「イベントインテリジェンスソリューション」として再定義するほどで、ベンダーがこの用語を乱用し、インフラ＆運用リーダーの間に広範な幻滅が広がったことを理由としている。テクノロジー自体は存続しているが、市場自体がインシデントの検出から解決までのギャップを認めた。 AIOps の限界を定義した3つの具体的な不足点：

原因なしの相関。 50件のアラートを1つのインシデントにグループ化することは有益だが、根本原因や何をすべきかはまだ示せない。
ブラックボックスな出力。 IT 専門家の大多数が、デプロイされた AIOps プラットフォームの ML 出力の解釈に苦労していると報告している。推論のない結論は信頼を得られない。
手がない。 古典的な AIOps はチケットを開いたり Webhook をトリガーしたりできたが、調査し、仮説を立て、修復方法を選択し、実行し、修正を検証することはできなかった。人間が依然としてアクチュエーターだった。

2.3 何が変わったか：推論モデル、ツール、プロトコル

2023年から2026年の間の3つの技術的解放がエージェント世代を可能にした。

フロンティア推論モデル。 大規模言語モデルは、ログ、設定ファイル、コードを読み、因果仮説を形成し、スコープの明確なドメインでエンジニアレベルの判断を持つマルチステップの修復を計画できる閾値を超えた。
ツール使用とコンピューター使用。 モデルは信頼性の高い関数呼び出しを獲得した — CLI コマンドの実行、API のクエリ、kubectl と Terraform の実行、ダッシュボードの読み取りができるようになり、推論を行動に変えた。
相互運用性標準。 Model Context Protocol（MCP）がエージェントをツールとデータソースに接続するためのデファクトスタンダードとして登場し、数か月のうちに数千万のダウンロードと1,000以上のサーバーエコシステムを達成した — エージェントレイヤーの TCP/IP の瞬間だ。

検証可能性が、エージェントが最初に成功する場所を説明している。インフラ運用は高度に検証可能なドメインだ。修復が SLO を回復するかどうか、Terraform のプランがクリーンに適用されるかどうか、ヘルスチェックが通過するかどうか — 明確なフィードバックループを持つドメインこそが、自律システムを自信を持ってデプロイできる場所であり、だからこそ運用はコーディングと並んでエージェント波をリードしている。

2.4 ベンダーのシグナル

ハイパースケーラーは投票した — 出荷した製品、名前が挙がった顧客、公開された数字で。AWS DevOps エージェントは AWS が最初の「フロンティアエージェント」の一つ（Security エージェントと並んで）として位置付け、2026年3月31日に United Airlines、T-Mobile、Western Governors University を立ち上げ顧客として一般提供に達した。AWS はプレビュー顧客が MTTR を最大75%削減し、調査を80%高速化し、根本原因の精度が94%だったと報告しており、WGU は本番調査の1件が推定2時間から28分に短縮されたと説明している（選択されたパイロットからのすべてのベンダー報告の数字 — 適切に割り引いて考えること — ただし独立した実務家が報告する40〜70%の楽観的な端に位置する）。Microsoft の Azure SRE エージェントは、Microsoft が驚くべき規模で自社に対して実行した後、2026年3月に GA となった。1,300以上のエージェント、35,000以上のインシデント緩和、20,000以上のエンジニアリング工数削減。Google はより保守的に同じ機能を出荷した。Gemini Cloud Assist のプロアクティブエージェントはバックグラウンドでアラートとコスト異常を自律的に調査するが、設計上、環境への変更は一切行わない。3つのクラウド、1つのパターン — すべてが調査優先の姿勢で立ち上げ、アクションは顧客ガバナンスの背後にゲートされている。地球上で最大のオペレーターたちによる自律性を段階的に導入しなければならないという公式の承認だ。市場も同じ方向に動いている。AIOps/AI-SRE カテゴリーは現在の約 $150億から2030年までに $360億に成長すると予測されている。

重要なポイントAIOps はシステムを可視化し、シグナルを解釈可能にした。エージェント運用はシステムを操作可能にする。違いは閉じたループにある。知覚から推論、行動、検証へ、人間が実行ではなく監督する形で。

​2.1 運用の4世代

​2.2 なぜ AIOps が不十分だったか

​2.3 何が変わったか：推論モデル、ツール、プロトコル

​2.4 ベンダーのシグナル

2.1 運用の4世代

2.2 なぜ AIOps が不十分だったか

2.3 何が変わったか：推論モデル、ツール、プロトコル

2.4 ベンダーのシグナル