사전 요구 사항
- CloudThinker 워크스페이스 — Pulse가 처음이신가요? 먼저 작동 방식을 읽어보세요
- 폴링할 서비스에 대한 읽기 권한이 있는 활성 AWS 연결
- 채팅 채널 신호를 원하는 경우 Slack 또는 Teams에 설치된 CloudThinker 봇
- 서드파티 신호를 원하는 경우 아웃바운드 웹훅을 지원하는 모니터링 도구
모니터링을 인시던트에 연결
이것은 전체 흐름입니다: 소스를 연결하고, 신호가 도착하는지 확인하고, 실행 가능한 클러스터가 인시던트로 에스컬레이션되도록 합니다.AWS 폴링
AWS 폴링을 사용하면 Pulse가 일정에 따라 AWS 계정에서 직접 이벤트를 가져올 수 있습니다 — 웹훅 구성이 필요하지 않습니다. 각 소스는 연결별로 활성화됩니다.| 소스 | Pulse가 수집하는 내용 | 주기 |
|---|---|---|
| CloudTrail | API 호출 감사 로그 — 누가, 언제, 어떤 리소스에서 무엇을 했는지 | 5분마다 |
| AWS Health | 계정 또는 리전에 영향을 미치는 서비스 상태 이벤트 | 5분마다 |
| Cost Anomaly | AWS Cost Anomaly Detector가 감지한 지출 급증 | 6시간마다 |
| GuardDuty | 위협 인텔리전스 발견 사항 — 손상된 인스턴스, 의심스러운 동작 | 주기적 |
| Config | Config 규칙에 대한 리소스 구성 드리프트 | 주기적 |
| Access Analyzer | IAM 및 S3 액세스 발견 사항 — 과도하게 허용적이거나 공개된 리소스 | 주기적 |
폴러 활성화
먼저 유효성 검사
소스 옆의 Validate를 클릭합니다. Pulse는 자격 증명에 필요한 읽기 권한이 있는지 드라이런을 수행합니다.성공 상태: ✓ 표시는 준비 완료를 의미하며, 오류 코드(예:
AccessDenied)는 누락된 항목을 정확히 알려줍니다.Slack 및 Teams 구독
CloudThinker 봇이 채널에 있으면 해당 채널의 메시지가 Pulse 신호가 됩니다 — 알림 봇 게시물, 인시던트 공지, 온콜 대화 — 인프라 이벤트와 함께 분류됩니다.
플랫폼 선택, 채널 선택, 봇 초대, 저장
구독은 개별적으로 켜고 끌 수 있습니다 — 구성을 잃지 않고 유지보수 기간 중 채널을 음소거하는 데 유용합니다.
채널 유형
| 유형 | 최적 용도 |
|---|---|
| Alert | 자동화된 알림 봇 전용 채널 |
| Communication | 인간 토론 채널 — 인시던트 채팅, 인수인계 |
| Mixed (기본값) | 자동화된 알림과 인간 메시지가 혼합된 채널 |
서드파티 웹훅
아웃바운드 웹훅을 지원하는 모니터링 도구라면 Pulse에 신호를 보낼 수 있습니다 — Datadog, Grafana, PagerDuty 등은 내장 필드 매핑과 함께 제공됩니다.웹훅 엔드포인트 생성
CloudThinker의 Webhooks로 이동하여 엔드포인트를 생성합니다 — 전체 설정은 웹훅을 참조하세요.
모니터링 도구 연결
생성된 URL을 도구의 웹훅 또는 알림 설정에 붙여넣습니다. 플랫폼별 지침, 인증 옵션, 필드 매핑은 웹훅 통합에 있습니다.
신호 카테고리
소스에 관계없이 모든 신호는 여덟 가지 카테고리 중 하나가 할당됩니다:| 카테고리 | 예시 |
|---|---|
| Compute | EC2 상태, Lambda 타임아웃, ECS 실패, 컨테이너 재시작 |
| Network | NAT 게이트웨이 이상, CloudFront 성능 저하, VPC 변경 |
| Security | GuardDuty 발견 사항, IAM 변경, S3 공개 액세스, WAF 트리거 |
| Cost | 비용 이상, 유휴 리소스, Savings Plan 감소, RI 만료 |
| Data | RDS 연결 문제, S3 작업, 데이터베이스 이벤트 |
| Deploy | CodeDeploy, ECS 롤아웃, CloudFormation 스택 변경 |
| Communication | Slack 및 Teams 메시지, 알림 봇 알림 |
| Unclassified | AI 분류기가 카테고리를 할당하기 전 기본값 |
다음 단계
클러스터
클러스터 라이프사이클 트리아지 — Active에서 Routed, Resolved까지
웹훅 통합
Datadog, Grafana, PagerDuty 등의 플랫폼별 설정
근본 원인 분석
에이전트가 에스컬레이션된 인시던트를 확실한 근본 원인까지 조사하는 방법
Pulse 분석
소스 전반의 노이즈 감소 및 신호 트렌드 측정