인시던트 생성

수동 인시던트 생성 폼
필수 필드
제목(Title)- 인시던트의 간결한 요약 (예: “프로덕션의 API Gateway 503 오류”)
- 인시던트 목록과 알림에 표시됨
- AI 에이전트가 인시던트 범위를 이해하는 데 사용됨
- 발생 중인 상황에 대한 상세 컨텍스트
- 관찰 가능한 증상 및 고객 영향
- 알려진 경우 이벤트 타임라인
- 이미 시도한 초기 문제 해결 단계
@를 사용하여 특정 에이전트 언급 (예:@alex,@tony) — 조사를 안내하는 데 사용
- 설명 옆의 Attach 버튼을 클릭하거나 파일을 폼에 드래그 & 드롭
- 클립보드에서 이미지를 붙여넣을 수도 있음
- 스크린샷, 로그 파일, 오류 내보내기, 기타 지원 증거 첨부
- 제한: 파일당 최대 5개, 각 25MB
- 첨부된 파일은 조사 중 AI 에이전트가 사용할 수 있어, 근본 원인을 더 빠르게 식별하는 추가 컨텍스트를 제공함
Critical: 전체 서비스 중단, 데이터 손실, 또는 보안 침해High: 주요 기능 저하, 상당한 고객 영향Medium: 부분적 기능 영향, 임시 해결 방법 가능Low: 경미한 문제, 최소한의 고객 영향
- 토폴로지 맵에서 선택
- RCA 에이전트가 조사 범위를 우선순위화하는 데 도움
- 활성화되는 전문 에이전트 결정
- 조사 후 추가 영향이 밝혀지면 업데이트 가능
다음에 발생하는 일
저장되면 CloudThinker가 자동으로:- RCA 작업 큐에 추가: 몇 초 내에 백그라운드에서 AI 조사 시작
- 에이전트 활성화: 전문 에이전트(Alex, Tony, Kai, Oliver)가 영향받은 서비스를 기반으로 인프라 분석
- 타임라인 구축: 가설 추적과 함께 실시간으로 조사 발견 사항 로그
- 근본 원인 식별: 구조화된 증거 체인을 이용한 가설 기반 분석
- 수정 제안: 영향 및 긴급도에 따라 우선순위가 정해진 실행 가능한 단계
수동 생성과 웹훅 생성 사용 시기
| 시나리오 | 권장 방법 |
|---|---|
| 모니터링 플랫폼 알림 | 웹훅 통합 |
| 고객 보고 문제 | 수동 로깅 |
| RCA 워크플로 테스트 | 수동 로깅 |
| 임시 조사 | 수동 로깅 |
| 사전적 상태 점검 | 수동 로깅 |
| 관찰된 성능 저하 (알림 전) | 수동 로깅 |
다음 단계
근본 원인 분석
AI 에이전트가 인시던트를 조사하고 증거 체인을 구축하는 방식을 이해합니다
웹훅 통합
PagerDuty, Datadog, Prometheus 등에서 인시던트 생성 자동화