프롬프트 문법
분석 쿼리의 일반적인 형식:| 구성 요소 | 설명 | 값 |
|---|---|---|
@agent | 쿼리를 실행하는 에이전트 | @alex (클라우드 및 컴퓨팅), @tony (데이터베이스), @kai (Kubernetes), @anna (예측 및 조율) |
#tool | 출력 형식 | #dashboard (시각적), #chart (인라인), #report (내보내기 가능), #alert (임계값 규칙) |
time range | 선택 사항; 기본값 7일 | last 7 days, last 30 days, last quarter, since last quarter |
대시보드
| 대시보드 | 표시 내용 | 에이전트 |
|---|---|---|
| 리소스 활용도 | 서비스, 리전, 계정별 CPU, 메모리, 스토리지, 네트워크 사용량 | Alex, Kai |
| Kubernetes 워크로드 효율성 | 네임스페이스별 파드 리소스 요청 대비 실제 사용량 | Kai |
| 애플리케이션 성능 | 인프라 부하와 상관 분석된 API 응답 시간 및 오류율 | Alex |
| 데이터베이스 성능 | P50/P95/P99 쿼리 지연 시간, 슬로우 쿼리, 연결 수 | Tony |
| 클러스터 상태 | CPU 압력, OOMKill 이벤트, 노드 상태 | Kai |
| 용량 여유 | 성능에 영향을 미치기 전의 리소스 여유 | Alex, Anna |
| 활용도 트렌드 | 선택한 기간 동안의 개선 또는 저하 | Alex |
알림
| 신호 | 감지 내용 | 기본 임계값 |
|---|---|---|
| CPU 압력 | 클러스터 전반에 걸친 지속적인 높은 CPU | 구성 가능한 기간 동안 >85% |
| 메모리 증가 | 해제 없는 지속적인 증가 (누수 패턴) | 시간당 >10% |
| 지연 시간 저하 | 기준 대비 P95 지연 시간 상승 | 기준의 >2배 |
| OOMKill | 메모리 한계로 인한 파드 종료 | 모든 발생 |
| 복제 지연 | 데이터베이스 레플리카가 기본에서 뒤처짐 | >30초 |
#alert 프롬프트를 사용하여 환경별로 구성 가능합니다.
신호 해석
| 패턴 | 가능한 원인 | 다음 단계 |
|---|---|---|
| 높은 활용도 + 정상 지연 시간 | 적절히 크기 산정된 워크로드 | 예약 용량 고려 — @alex에게 문의 |
| 낮은 활용도 + 높은 비용 | 과잉 프로비저닝된 리소스 | @alex로 적정 규모 조정 |
| 높은 지연 시간 + 정상 활용도 | 애플리케이션 또는 데이터베이스 병목 | @tony에게 문의 |
| 활용도 급등 + OOMKill | 리소스 한계 잘못 구성 | @kai에게 문의 |
| 트래픽 변화 없는 비용 급등 | 구성 드리프트 또는 고아 리소스 | @alex에게 문의하거나 CloudKeepers 결과 확인 |
예시
활용도 대시보드:관련 항목
CloudKeepers
인프라를 지속적으로 모니터링하고 결과를 표시하는 Keepers 설정
비용 분석
연결된 계정 전반의 지출 패턴 및 이상 분석
평가
인프라 상태를 기준으로 삼기 위한 Well-Architected 평가 실행
토폴로지
인프라 의존성 그래프와 분석 신호 상관 분석