Cách hoạt động
Điều tra hoàn thành
Khi một điều tra RCA xác định được nguyên nhân gốc rễ, CloudThinker tự động trích xuất các bài học quan trọng — vấn đề, nguyên nhân gốc rễ, các bước khắc phục, các dịch vụ bị ảnh hưởng và mức độ tin cậy.
Incident mới xảy ra
Khi một incident mới kích hoạt điều tra RCA, CloudThinker tìm kiếm các incident tương tự trong quá khứ trong workspace của bạn.
Những gì được ghi lại
Mỗi điều tra hoàn thành tự động lưu:| Thông tin | Ví dụ |
|---|---|
| Nguyên nhân gốc rễ | ”Cạn kiệt connection pool do database connection bị rò rỉ” |
| Các bước khắc phục | Các hành động ưu tiên mà AI đề xuất |
| Dịch vụ bị ảnh hưởng | Các dịch vụ liên quan đến incident |
| Mức độ nghiêm trọng | Cấp độ nghiêm trọng của incident |
| Độ tin cậy | Mức độ chắc chắn của AI về nguyên nhân gốc rễ |
Chỉ báo recall
Khi một điều tra sử dụng tri thức từ các incident trong quá khứ, bạn sẽ thấy một badge trên kết quả RCA:Được tham khảo từ N incident tương tựĐiều này cho bạn biết AI đã tham chiếu các điều tra trước đó để hướng dẫn phân tích. Di chuột qua badge để xem chi tiết.
Khi nào bộ nhớ hữu ích nhất
- Sự cố tái diễn — Vấn đề kết nối database, rò rỉ bộ nhớ, suy giảm sau triển khai — các mẫu lặp đi lặp lại được chẩn đoán nhanh hơn mỗi lần.
- Nguyên nhân gốc rễ tương tự — CPU tăng đột biến ở Service A do thay đổi cấu hình? Lần tới khi CPU tăng đột biến ở Service B, AI biết kiểm tra cấu hình trước.
- Duy trì tri thức nhóm — Khi kỹ sư rời đi hoặc luân chuyển, những hiểu biết về debug của họ vẫn còn trong hệ thống.
- Giải quyết nhanh hơn — Thay vì bắt đầu từ đầu, AI bắt đầu với các giả thuyết có cơ sở dựa trên những gì đã hiệu quả trước đây.
Cách cải thiện theo thời gian
Incident Memory trở nên thông minh hơn khi nhóm của bạn sử dụng CloudThinker:- Củng cố — Khi cùng một nguyên nhân gốc rễ xuất hiện trong nhiều incident, mẫu đó được tăng cường và ưu tiên trong các tìm kiếm tương lai
- Thay thế — Điều tra lại một incident sẽ thay thế bộ nhớ cũ bằng kết quả cập nhật, giữ tri thức luôn mới
- Loại bỏ trùng lặp — Các kết quả giống nhau tự động được hợp nhất thay vì nhân đôi
Cấu hình
Incident Memory được bật theo mặc định khi workspace của bạn có tính năng bộ nhớ hoạt động. Không cần thiết lập thêm.Incident Memory chỉ ghi lại bài học từ các điều tra RCA đạt được kết luận (xác định được nguyên nhân gốc rễ, báo động giả hoặc không tìm thấy). Các điều tra bị hủy hoặc thất bại không được lưu trữ.
Thực tiễn tốt nhất
- Cung cấp mô tả incident chi tiết — ngữ cảnh phong phú hơn giúp AI tìm kiếm kết quả khớp tốt hơn từ các incident trong quá khứ
- Chạy RCA đến hoàn thành — các điều tra đạt đến kết quả đóng góp những bộ nhớ hữu ích nhất
- Kết nối topology của bạn — các incident với các dịch vụ bị ảnh hưởng được ánh xạ tạo ra kết quả khớp chính xác hơn trong tương lai
- Điều tra lại khi cần — chạy RCA lần hai trên cùng một incident sẽ cập nhật bộ nhớ với kết quả tốt hơn
Liên quan
Phân tích nguyên nhân gốc rễ
Hiểu cách AI agent điều tra incident và xây dựng chuỗi bằng chứng mà bộ nhớ cung cấp thông tin.
Runbooks
Kết nối runbook vận hành để agent có thể tìm kiếm và thực thi các bước khắc phục trong quá trình xử lý incident.