BT altyapılarının giderek karmaşıklaştığı günümüzde, sistemlerin istikrarlı ve kesintisiz çalışmasını sağlamak, sadece olay (incident) sonrası reaksiyonlarla değil, proaktif davranışlarla mümkün hâle geliyor. Bu noktada Anomaly Detection— yani Anomali Tespiti — izleme (monitoring) süreçlerinin en kritik bileşenlerinden biri olarak öne çıkıyor.
Anomaly Detection, bir sistemde gözlemlenen veri noktalarının normal davranıştan sapmalarını, istatistiksel ve/veya makine öğrenimi teknikleriyle tespit etme sürecidir. Bu sapmalar; donanım arızası, güvenlik ihlali, konfigürasyon hatası ya da performans darboğazı gibi sistemsel sorunlara işaret edebilir.
Anomali, üç temel kategoride incelenir:
Teknik olarak anomaly detection, aşağıdaki yöntemlerle gerçekleştirilir:
Bu görselde, çoğu veri noktasının bir arada kümelendiği bir dağılım grafiği görebilirsiniz. Ancak, bu kümenin oldukça uzağında, tek başına duran bir veri noktası var. İşte bu tek, izole veri noktası bir "nokta anomalisi"ni temsil eder. Tıpkı verdiğimiz örnekteki gibi, bir kullanıcının normalde yapmadığı, gece yarısı çok büyük bir veri indirme işlemi gibi, bu izole nokta da normal davranıştan önemli ölçüde sapan bir durumu gösterir.
Bu grafikte, bir web sitesinin 24 saatlik trafik hacmi gösteriliyor. Gündüz saatlerinde (örneğin, sabah 9'dan akşam 5'e kadar) trafik yoğunluğu yüksek ve bu beklenen, normal bir durum. Ancak, gece geç saatlerde (örneğin, gece 2'den 4'e kadar) de benzer şekilde yüksek bir trafik artışı görülüyor. Normalde gece saatlerinde trafik çok düşük olmalıdır. Bu nedenle, gece yaşanan bu yüksek trafik artışı, bağlam (gece saati) göz önüne alındığında bir anomali olarak kabul edilir. Görseldeki vurgulanmış bölüm bu bağlamsal anomalinin kendisidir.
Bu grafikte, sunucu disk kullanımının zaman içindeki değişimi gösteriliyor. Başlangıçta, disk kullanımı normal dalgalanmalar gösteriyor ve belirli bir aralıkta seyrediyor. Ancak daha sonra, disk kullanımının yavaşça ve sürekli olarak arttığı, normal çalışma aralığının üzerine çıktığı bir trend gözlemleniyor.
Klasik monitoring sistemleri genellikle threshold-based yani eşik tabanlı çalışır: “CPU %90’ı geçtiğinde alarm üret”, “disk alanı %95 dolduğunda uyar” gibi. Bu yapı, öngörülebilir durumlarda işe yarar ancak aşağıdaki durumlarda yetersiz kalır:
İşte anomaly detection burada devreye girer. Modern monitoring sistemleri artık öngörüsel analiz (predictive analytics) ve davranış modelleme (behavioral modeling) yeteneklerini kullanarak sistemin “normal” davranışını öğrenir ve buna aykırı durumları tespit eder. Bu şu avantajları sağlar:
Bir veri merkezinde çalışan 200 sunucunun CPU kullanımını izlediğinizi düşünün. Geleneksel monitoring, %90 kullanım üstü için alarm üretir. Ancak anomaly detection, 50 sunucunun eş zamanlı olarak %70’in üzerine çıkmasının, geçmiş davranış paternine göre anormal olduğunu tespit edebilir. Bu, muhtemel bir malware yayılımı, iş yükü dağılım bozukluğu ya da yanlış yapılandırılmış bir cron job olabilir.
Anomaly detection, sadece bir özellik değil, izleme kültürünün evrimsel bir parçasıdır. Giderek daha fazla sistem, observability-first (gözlemlenebilirlik odaklı) mimarilere geçerken; metrik, log ve trace verilerini birlikte analiz eden platformlarda anomaly detection motorları artık temel bileşen hâline gelmiştir.
Kurallar yerine öğrenen sistemler, reaktif yaklaşımlar yerine proaktif müdahale yetenekleri… Anomaly Detection, izleme stratejilerinin geleceğinde kilit bir roldedir.
Monitoring çözümleri ve geliştirmeleri için ODYA Teknoloji ekibi hep yanınızda. Tüm ihtiyaçlarınız için formu doldurun, sizinle iletişime geçelim!