동작 방식
어떤 단계도 수동 인계를 필요로 하지 않습니다 — 각 레이어가 다음 레이어에 자동으로 공급됩니다:- 수집 — AWS, Datadog, Slack, PagerDuty 등의 소스에서 이벤트가 하나의 Pulse 피드로 스트리밍됩니다.
- 필터 및 연관 — 억제 레이어가 중복, 속도 제한된 버스트, 플래핑 리소스를 제거합니다. 관련 신호는 클러스터로 그룹화되어, 동일한 노드 풀에 관한 9개의 알림이 하나의 항목이 됩니다.
- 분류 및 에스컬레이션 — 모든 신호에 카테고리, 표준 심각도, 실행 가능성 점수가 부여됩니다. 클러스터가 Critical 또는 High이거나 AI가 실행 가능으로 표시하면 자동으로 인시던트로 에스컬레이션됩니다.
- 조사 — AI 에이전트가 명시적 가설을 수립하고, 메트릭과 로그에 대해 각 가설을 테스트하며, 구조화된 리포트를 생성합니다: 가장 가능성 높은 근본 원인, 증거 체인, 배제된 이론.
- 해결 및 기억 — 에이전트가 설정한 자율성 모드(Manual 또는 Auto)에 따라 루트 원인에 맞는 런북을 찾아 실행합니다. 각 해결은 인시던트 메모리에 피드되어 다음 조사를 더 빠르게 합니다.
주요 기능
| 기능 | 설명 | 가이드 |
|---|---|---|
| 신호 소스 연결 | AWS, Slack, Teams, 웹훅 이벤트를 Pulse에 공급 | Pulse 설정 |
| 신호 클러스터 관리 | 연관된 신호 그룹을 검토, 병합, 조치 | 클러스터 |
| AI 근본 원인 분석 실행 | 가설 주도 조사를 통해 구조화된 RCA 리포트로 | 동작 방식 |
| 모니터링 웹훅 수집 | PagerDuty, Datadog, CloudWatch 등의 알림 라우팅 | 웹훅 연동 |
| 수정 자동화 | 에이전트가 일치하는 런북 절차를 실행 | 런북 |
| 인시던트 수동 기록 | Pulse 외부에서 시작된 인시던트 기록 | 수동 기록 |
| 모든 인시던트에서 학습 | 효과적이었던 것들을 재사용 — 쿼리, 기법, 런북 단계 | 인시던트 메모리 |
| 루프 측정 | 노이즈 감소, 클러스터 MTTR, 전환율 추적 | Pulse Analytics |
핵심 개념
| 개념 | 의미 |
|---|---|
| 신호 | 연결된 소스에서 발생한 단일 정규화된 이벤트 |
| 클러스터 | 하나의 항목으로 처리되는 연관된 신호의 그룹 |
| 인시던트 | 클러스터가 에스컬레이션될 때 생성되는 조사 객체 |
| 런북 | 에이전트가 수정 중 찾아 실행할 수 있는 운영 절차 |
| 인시던트 메모리 | 과거 인시던트를 해결한 기법, 쿼리, 단계의 기록 |
시작하기
신호 소스 연결
Pulse에 공급을 시작하기 위해 AWS, Slack, Teams, 웹훅 소스를 연결합니다.
웹훅 연동 설정
PagerDuty, Datadog, CloudWatch 등의 알림을 응답 루프로 라우팅합니다.
런북 추가
에이전트가 수정 중 실행할 수 있는 절차를 제공합니다.
조사 동작 방식 확인
가설 주도 근본 원인 분석의 처음부터 끝까지를 따라갑니다.