1. Tổng quan
-
Truyền thống: giám sát hệ thống dựa trên ngưỡng (CPU > 80%, RAM > 90%) → dễ quá tải cảnh báo, bỏ sót lỗi tiềm ẩn.
-
Với AI, hệ thống có thể:
-
Học mô hình hoạt động bình thường, phát hiện bất thường (Anomaly Detection).
-
Dự báo lỗi sắp xảy ra (predictive alerting).
-
Tự động phân loại cảnh báo, giảm cảnh báo giả.
-
🔍 Mục tiêu: Giảm sự cố hệ thống, tăng thời gian phản hồi, tối ưu vận hành.