Chuyển đến nội dung chính
Không phải tất cả incident đều xuất phát từ nền tảng giám sát. Khi bạn quan sát trực tiếp các vấn đề, nhận báo cáo từ khách hàng hoặc cần kiểm tra quy trình RCA trước khi cấu hình webhook, việc tạo incident thủ công cung cấp quyền truy cập ngay lập tức vào khả năng điều tra được hỗ trợ bởi AI của CloudThinker. Ghi nhật ký thủ công đảm bảo mọi vấn đề — dù được phát hiện bởi cảnh báo tự động hay quan sát của con người — đều được theo dõi có cấu trúc và phân tích nguyên nhân gốc rễ có hệ thống.

Tạo incident

Form tạo incident thủ công với các trường tiêu đề, mô tả, mức độ nghiêm trọng và dịch vụ bị ảnh hưởng

Form tạo incident thủ công

Các trường bắt buộc

Title
  • Tóm tắt ngắn gọn về incident (ví dụ: “API Gateway 503 errors in production”)
  • Xuất hiện trong danh sách incident và thông báo
  • Được các tác nhân AI sử dụng để hiểu phạm vi incident
Description
  • Ngữ cảnh chi tiết về những gì đang xảy ra
  • Triệu chứng có thể quan sát và tác động đến khách hàng
  • Dòng thời gian của sự kiện nếu đã biết
  • Bất kỳ bước xử lý sự cố ban đầu nào đã thử
  • Dùng @ để đề cập đến các tác nhân cụ thể (ví dụ: @alex, @tony) để hướng cuộc điều tra
Attachments (tùy chọn)
  • Nhấp nút Attach bên cạnh mô tả, hoặc kéo và thả tệp trực tiếp vào form
  • Bạn cũng có thể dán hình ảnh từ clipboard của mình
  • Đính kèm ảnh chụp màn hình, tệp log, xuất lỗi hoặc bất kỳ bằng chứng hỗ trợ nào
  • Giới hạn: tối đa 5 tệp, 25MB mỗi tệp
  • Các tệp đính kèm có sẵn cho các tác nhân AI trong quá trình điều tra, cung cấp thêm ngữ cảnh để xác định nguyên nhân gốc rễ nhanh hơn
Severity
  • Critical: Ngừng dịch vụ hoàn toàn, mất dữ liệu hoặc vi phạm bảo mật
  • High: Chức năng chính bị suy giảm, tác động đáng kể đến khách hàng
  • Medium: Chức năng một phần bị ảnh hưởng, có giải pháp thay thế
  • Low: Vấn đề nhỏ, tác động tối thiểu đến khách hàng
Affected Services (tùy chọn)
  • Chọn từ bản đồ topology của bạn
  • Giúp các tác nhân RCA ưu tiên phạm vi điều tra
  • Xác định các tác nhân chuyên biệt nào được kích hoạt
  • Có thể cập nhật sau khi điều tra tiết lộ thêm tác động

Điều gì xảy ra tiếp theo

Sau khi lưu, CloudThinker tự động:
  1. Xếp hàng Tác vụ RCA: Điều tra AI bắt đầu ở nền trong vòng vài giây
  2. Kích hoạt Tác nhân: Các tác nhân chuyên biệt (Alex, Tony, Kai, Oliver) phân tích hạ tầng của bạn dựa trên các dịch vụ bị ảnh hưởng
  3. Xây dựng Dòng thời gian: Kết quả điều tra được ghi theo thời gian thực với theo dõi giả thuyết
  4. Xác định Nguyên nhân Gốc rễ: Phân tích theo giả thuyết với chuỗi bằng chứng có cấu trúc
  5. Đề xuất Biện pháp Khắc phục: Các bước cần làm được ưu tiên theo tác động và mức độ khẩn cấp
Theo dõi tiến độ trong dòng thời gian Phân tích Nguyên nhân Gốc rễ, nơi bạn sẽ thấy các tác nhân thu thập ngữ cảnh, kiểm tra giả thuyết và xây dựng chuỗi bằng chứng.

Khi nào dùng tạo thủ công hay webhook

Tình huốngPhương pháp được đề xuất
Cảnh báo từ nền tảng giám sátTích hợp Webhook
Vấn đề do khách hàng báo cáoGhi nhật ký Thủ công
Kiểm tra quy trình RCAGhi nhật ký Thủ công
Điều tra đột xuấtGhi nhật ký Thủ công
Kiểm tra sức khỏe chủ độngGhi nhật ký Thủ công
Suy giảm quan sát được (trước cảnh báo)Ghi nhật ký Thủ công

Bước tiếp theo

Root Cause Analysis

Tìm hiểu cách các tác nhân AI điều tra incident và xây dựng chuỗi bằng chứng

Webhook Integrations

Tự động hóa tạo incident từ PagerDuty, Datadog, Prometheus và nhiều hơn nữa