Tạo incident

Form tạo incident thủ công
Các trường bắt buộc
Title- Tóm tắt ngắn gọn về incident (ví dụ: “API Gateway 503 errors in production”)
- Xuất hiện trong danh sách incident và thông báo
- Được các tác nhân AI sử dụng để hiểu phạm vi incident
- Ngữ cảnh chi tiết về những gì đang xảy ra
- Triệu chứng có thể quan sát và tác động đến khách hàng
- Dòng thời gian của sự kiện nếu đã biết
- Bất kỳ bước xử lý sự cố ban đầu nào đã thử
- Dùng
@để đề cập đến các tác nhân cụ thể (ví dụ:@alex,@tony) để hướng cuộc điều tra
- Nhấp nút Attach bên cạnh mô tả, hoặc kéo và thả tệp trực tiếp vào form
- Bạn cũng có thể dán hình ảnh từ clipboard của mình
- Đính kèm ảnh chụp màn hình, tệp log, xuất lỗi hoặc bất kỳ bằng chứng hỗ trợ nào
- Giới hạn: tối đa 5 tệp, 25MB mỗi tệp
- Các tệp đính kèm có sẵn cho các tác nhân AI trong quá trình điều tra, cung cấp thêm ngữ cảnh để xác định nguyên nhân gốc rễ nhanh hơn
Critical: Ngừng dịch vụ hoàn toàn, mất dữ liệu hoặc vi phạm bảo mậtHigh: Chức năng chính bị suy giảm, tác động đáng kể đến khách hàngMedium: Chức năng một phần bị ảnh hưởng, có giải pháp thay thếLow: Vấn đề nhỏ, tác động tối thiểu đến khách hàng
- Chọn từ bản đồ topology của bạn
- Giúp các tác nhân RCA ưu tiên phạm vi điều tra
- Xác định các tác nhân chuyên biệt nào được kích hoạt
- Có thể cập nhật sau khi điều tra tiết lộ thêm tác động
Điều gì xảy ra tiếp theo
Sau khi lưu, CloudThinker tự động:- Xếp hàng Tác vụ RCA: Điều tra AI bắt đầu ở nền trong vòng vài giây
- Kích hoạt Tác nhân: Các tác nhân chuyên biệt (Alex, Tony, Kai, Oliver) phân tích hạ tầng của bạn dựa trên các dịch vụ bị ảnh hưởng
- Xây dựng Dòng thời gian: Kết quả điều tra được ghi theo thời gian thực với theo dõi giả thuyết
- Xác định Nguyên nhân Gốc rễ: Phân tích theo giả thuyết với chuỗi bằng chứng có cấu trúc
- Đề xuất Biện pháp Khắc phục: Các bước cần làm được ưu tiên theo tác động và mức độ khẩn cấp
Khi nào dùng tạo thủ công hay webhook
| Tình huống | Phương pháp được đề xuất |
|---|---|
| Cảnh báo từ nền tảng giám sát | Tích hợp Webhook |
| Vấn đề do khách hàng báo cáo | Ghi nhật ký Thủ công |
| Kiểm tra quy trình RCA | Ghi nhật ký Thủ công |
| Điều tra đột xuất | Ghi nhật ký Thủ công |
| Kiểm tra sức khỏe chủ động | Ghi nhật ký Thủ công |
| Suy giảm quan sát được (trước cảnh báo) | Ghi nhật ký Thủ công |
Bước tiếp theo
Root Cause Analysis
Tìm hiểu cách các tác nhân AI điều tra incident và xây dựng chuỗi bằng chứng
Webhook Integrations
Tự động hóa tạo incident từ PagerDuty, Datadog, Prometheus và nhiều hơn nữa