ITIL tabanlı süreçler, 7/24 izleme ve disiplinli değişiklik yönetimiyle altyapınızı öngörülebilir, ölçülebilir ve verimli bir yapıya kavuşturuyoruz. Sistemlerin hata vermesini beklemek (Break-Fix modeli) yerine, altyapıyı 7/24 izleyerek olası darboğazları ve arızaları henüz oluşmadan tespit ediyoruz. ODYA Yöneitlen Hizmetler ekibi olarak sunucuları, ağ cihazları ve uygulamaları sürekli denetim altına alıyoruz.
Proaktif tespit, anlık uyarı ve önleyici müdahale süreci. ODYA Yönetilen Hizmetler ile altyapıda 7/24 görünürlük ve hakimiyet!
Sunucu, ağ cihazı, uygulama ve veritabanı katmanlarına izleme agentları (Zabbix, Prometheus, Datadog, vb.) kurulur. SNMP trap'leri, syslog akışları ve API entegrasyonları tek bir merkezi platforma yönlendirilir.
CPU, RAM, disk, ağ bant genişliği, yanıt süresi (latency), servis durumu gibi metrikler için kritik / uyarı / bilgi seviyelerinde eşikler tanımlanır. Dinamik baseline algoritmaları ile anormal davranışlar otomatik tespit edilir.
Tek bir altyapı arızasının tetikleyebileceği kaskad alarmlar korelasyon kurallarıyla birleştirilir. Flapping (titreşen) alarmlar, bakım pencereleri ve suppression kurallarıyla gereksiz bildirimler engellenir.
Tetiklenen alarm, önce L1 NOC ekibine iletilir. Belirlenen SLA süresi içinde çözüm sağlanamadığında otomatik eskalasyon akışıyla L2 / L3 mühendislere ve müşteri yetkililerine bildirim gider (SMS, e-posta, Teams/Slack, PagerDuty).
ODYA Automated NOC; tüm altyapı bileşenlerinin anlık durumu görselleştirilir, dahsboardlar üzerinden sunar. Kapasite trendleri, SLA göstergeleri ve son 30 günlük alarm geçmişi müşteri portalında erişilebilir halde tutulur. Ayrıca rol bazlı dashboardlar ile hem teknik ekiplere özel hem CIO, IT Direktörleri gibi karar vericilere özel ayrı dahsboardlar oluşturur.
ODYA Yönetilen Hizmetler ile ITIL çerçevesi uyumlu IT Service Management süreçleri. ITIL uyumlu tespit → sınıflandırma → çözüm → kapama döngüsü
İzleme sisteminden gelen alarm veya son kullanıcı bildirimiyle SPIDYA ITSM üzerinde *AI desteği ile otomatik olay kaydı (incident ticket) açılır. Kayıt; CI (Configuration Item), etki alanı, kullanıcı sayısı ve ön belirti detaylarıyla zenginleştirilir.
Olay; etki (kaç kullanıcı / sistem etkileniyor) ve aciliyet (iş sürekliliğine etkisi) matrisine göre P1–P4 arasında önceliklendirilir. P1 olaylar için war room prosedürü devreye girer ve bir Incident Manager atanır.
L1 önce bilinen çözümler için Knowledge Base'i tarar; bulamazsa L2/L3'e eskalasyon yapılır. Log analizi (ODYA Automated NOC), paket yakalama, APM izleme, CI ilişkileri, servis ağaçları ve altyapı snapshot'larıyla kök neden belirlenir.
Geçici çözüm (workaround) ile servis önce ayağa kaldırılır, ardından kalıcı düzeltme uygulanır. Tüm müdahale adımları ticket'a zaman damgasıyla kaydedilir. Etkilenen kullanıcılar e-posta / portal üzerinden bilgilendirilir.
P1/P2 olaylar için 48 saat içinde PIR toplantısı düzenlenir. Zaman çizelgesi, kök neden, etki analizi ve tekrar önleme aksiyonları yazılı rapora dökülür. Problem kaydı açılarak kalıcı çözüm izlenir.
Standart hizmet taleplerinin katalog bazlı, otomasyon destekli karşılanması.ODYA Yönetilen Hizmetler; öngörülebilir, önceden onaylanmış hizmet ihtiyaçlarını hızlı ve tutarlı biçimde karşılamak için süreçleri yürütür. Yani "yeni bir kullanıcı aç", "disk kapasitesini artır", "VPN erişimi tanımla" gibi işlemler hızlı ve kolay bir şekilde yönetilir.
Müşteriyle birlikte standart talep türleri (yeni kullanıcı oluşturma, disk genişletme, firewall kural değişikliği, SSL sertifika yenileme, vb.) belirlenir. Her talep tipi için onay akışı, görevli ekip, öncelik ve tamamlanma süresi (fulfillment SLA) tanımlanır.
Son kullanıcılar talep girişini self-service portal, e-posta veya entegrasyon API'si üzerinden yapabilir. Chatbot / sanal asistan entegrasyonu ile sıkça gelen basit talepler otomatik karşılanır (şifre sıfırlama, hesap kilidi açma, vb.).
Gelen talep; talep tipi, öncelik ve müşteri profili eşleştirmesiyle otomatik olarak doğru ekibe ve kişiye atanır. İş kuralları motoru (business rule engine) gereksiz yönlendirme döngülerini önler.
Görevli mühendis talebi alır, ön koşulları (yetki, kapasite, bağımlılıklar) kontrol eder, gerekirse onay alır ve işlemi gerçekleştirir. Tüm adımlar ticket üzerinde belgelenir.
Talep tamamlandığında kullanıcıya bildirim gönderilir ve onayı beklenir. Belirli süre içinde geri dönüş olmazsa otomatik kapatma kuralı devreye girer. Memnuniyet anketi ile kalite ölçümü yapılır.
Riskli altyapı değişikliklerini kontrollü, geri alınabilir ve belgelenmiş şekilde uygulama
Altyapıyı etkileyecek her değişiklik için Request for Change (RFC) belgesi hazırlanır. Değişikliğin kapsamı, gerekçesi, etkilenecek sistemler, uygulama adımları ve rollback planı belgelenir.
CAB (Change Advisory Board) veya otomatik kural motoru; değişikliği Normal, Standart veya Acil olarak sınıflandırır. Risk puanı hesaplanır: etkilenen CI sayısı, değişiklik karmaşıklığı, son başarısız değişiklik geçmişi ve mevcut alarm durumu dikkate alınır.
Risk seviyesine göre tek kişi onayından çok kademeli CAB onayına kadar değişen onay süreci uygulanır. Değişiklik, sistem üzerindeki trafik ve iş yoğunluğu analiz edilerek en uygun bakım penceresine planlanır.
Değişiklik, IaC veya runbook adımlarıyla sistematik biçimde uygulanır. Uygulama sırasında izleme platformu yoğunlaştırılmış mod'a alınır; her adım sonrası doğrulama kontrolleri çalıştırılır.
Değişiklik başarılıysa smoke test & doğrulama adımları çalıştırılır, ticket kapatılır ve CMDB güncellenir. Sorun tespit edilirse önceden hazırlanan rollback planı devreye alınır ve olay yönetimi süreci başlatılır.
Ölçülemeyen iyileştirilemez! Veri odaklı sürekli geliştirme döngüsü
Müşteriyle birlikte anahtar performans göstergeleri belirlenir: MTTR (Mean Time to Repair), MTBF (Mean Time Between Failures), SLA Uyum Oranı, First Call Resolution, Kapasite Kullanım Oranı. Her metriğin hesaplama yöntemi ve hedef değeri sözleşmeye işlenir.
Tüm metrikler izleme araçlarından, ITSM sisteminden ve log platformlarından otomatik olarak toplanır. Zaman serisi veritabanlarında (InfluxDB, Prometheus TSDB) uzun süreli depolanır; ham veriye API ile erişim sağlanır.
Haftalık operasyonel özet (olay sayısı, açık ticket yaşı, SLA sapmalar) ve aylık yönetim raporu (trend analizi, kapasite projeksiyonu, iyileştirme önerileri) otomatik oluşturulur ve müşteri portalına yüklenir.
Aylık Operasyonel SRM ve üç aylık Stratejik SRM ile müşteriyle birlikte metriklerin gözden geçirilmesi, kök neden tartışmaları ve bir sonraki dönem için iyileştirme hedefleri belirlenir. Aksiyonlar takip listesine alınır.
Verilere dayalı olarak tekrar eden sorunlar Problem Management ile kökten çözüme kavuşturulur. Otomasyon fırsatları belirlenir, runbook'lar güncellenir ve ITIL CSI çerçevesiyle her dönem operasyonel olgunluk düzeyi artırılır.