메인 콘텐츠로 건너뛰기
모든 인시던트가 모니터링 플랫폼에서 시작되는 것은 아닙니다. 직접 문제를 발견하거나, 고객 보고를 받거나, 웹훅을 구성하기 전에 RCA 워크플로를 테스트해야 할 때, 수동 인시던트 생성을 통해 CloudThinker의 AI 기반 조사 기능에 즉시 접근할 수 있습니다. 수동 로깅은 자동화된 알림이든 사람의 관찰이든 모든 문제가 구조화된 추적과 체계적인 근본 원인 분석을 받도록 보장합니다.

인시던트 생성

제목, 설명, 심각도, 영향받은 서비스 필드가 있는 수동 인시던트 생성 폼

수동 인시던트 생성 폼

필수 필드

제목(Title)
  • 인시던트의 간결한 요약 (예: “프로덕션의 API Gateway 503 오류”)
  • 인시던트 목록과 알림에 표시됨
  • AI 에이전트가 인시던트 범위를 이해하는 데 사용됨
설명(Description)
  • 발생 중인 상황에 대한 상세 컨텍스트
  • 관찰 가능한 증상 및 고객 영향
  • 알려진 경우 이벤트 타임라인
  • 이미 시도한 초기 문제 해결 단계
  • @를 사용하여 특정 에이전트 언급 (예: @alex, @tony) — 조사를 안내하는 데 사용
첨부 파일(Attachments) (선택사항)
  • 설명 옆의 Attach 버튼을 클릭하거나 파일을 폼에 드래그 & 드롭
  • 클립보드에서 이미지를 붙여넣을 수도 있음
  • 스크린샷, 로그 파일, 오류 내보내기, 기타 지원 증거 첨부
  • 제한: 파일당 최대 5개, 각 25MB
  • 첨부된 파일은 조사 중 AI 에이전트가 사용할 수 있어, 근본 원인을 더 빠르게 식별하는 추가 컨텍스트를 제공함
심각도(Severity)
  • Critical: 전체 서비스 중단, 데이터 손실, 또는 보안 침해
  • High: 주요 기능 저하, 상당한 고객 영향
  • Medium: 부분적 기능 영향, 임시 해결 방법 가능
  • Low: 경미한 문제, 최소한의 고객 영향
영향받은 서비스(Affected Services) (선택사항)
  • 토폴로지 맵에서 선택
  • RCA 에이전트가 조사 범위를 우선순위화하는 데 도움
  • 활성화되는 전문 에이전트 결정
  • 조사 후 추가 영향이 밝혀지면 업데이트 가능

다음에 발생하는 일

저장되면 CloudThinker가 자동으로:
  1. RCA 작업 큐에 추가: 몇 초 내에 백그라운드에서 AI 조사 시작
  2. 에이전트 활성화: 전문 에이전트(Alex, Tony, Kai, Oliver)가 영향받은 서비스를 기반으로 인프라 분석
  3. 타임라인 구축: 가설 추적과 함께 실시간으로 조사 발견 사항 로그
  4. 근본 원인 식별: 구조화된 증거 체인을 이용한 가설 기반 분석
  5. 수정 제안: 영향 및 긴급도에 따라 우선순위가 정해진 실행 가능한 단계
근본 원인 분석 타임라인에서 진행 상황을 추적하세요. 에이전트가 컨텍스트를 수집하고, 가설을 검증하며, 증거 체인을 구축하는 것을 볼 수 있습니다.

수동 생성과 웹훅 생성 사용 시기

시나리오권장 방법
모니터링 플랫폼 알림웹훅 통합
고객 보고 문제수동 로깅
RCA 워크플로 테스트수동 로깅
임시 조사수동 로깅
사전적 상태 점검수동 로깅
관찰된 성능 저하 (알림 전)수동 로깅

다음 단계

근본 원인 분석

AI 에이전트가 인시던트를 조사하고 증거 체인을 구축하는 방식을 이해합니다

웹훅 통합

PagerDuty, Datadog, Prometheus 등에서 인시던트 생성 자동화