Her kurumun düşebileceği ezber hatalarla yüzleşmek ve proaktif aksiyonlar almak, bir şirketin hayatta kalma refleksinin temelidir. Kriz anında "Eyvah, biz bunu böyle biliyorduk!" dememek için bu illüzyonları yıkmak zorundayız. Çünkü iş sürekliliği, teknik altyapıdan kurum kültürüne, finansal operasyonlardan siber risklere ve tedarik zincirine kadar uzanan bütünsel bir yaklaşımla ele alınması gereken, şirketlerin var olma mücadelesidir.
Gelin bu geniş yelpaze içinde doğru bilinen ancak şirketlerin faaliyetini durdurabilecek 10 kritik ezber ve gerçek üzerinden iş sürekliliğini masaya yatıralım.
1. Bulut illüzyonu
Yanlış ezber: "Sistemlerimizi buluta taşıdık, artık iş sürekliliği problemimiz kalmadı."
Gerçek: Bulut sağlayıcıları fiziksel altyapıyı korur ancak operasyonel süreçlerinizi, yazılımsal mimari hatalarınızı veya sofistike siber saldırıları yönetmez. Bulut bir kurtarıcı değil, sadece bir araçtır. Bulut mimarisini coğrafi olarak yedekli (Multi-Region/Multi-Zone) kurgulamazsanız, bulutta da tek noktadan kırılırsınız.
Örnek senaryo: Küresel bir e-ticaret şirketi, tüm altyapısını tek bir bulut sağlayıcısının tek bir veri merkezine taşır. Bulut sağlayıcısının o bölgesinde yaşanan 6 saatlik bir ağ kesintisi (fiziki fiber kopması), şirketin tüm platformunu erişilmez kılar. Şirket, bulut mimarisini farklı bir coğrafi bölgeyle yedeklemediği için milyonlarca dolar ciro ve ciddi bir itibar kaybeder.
2. "Yedek alıyoruz" rehaveti
Yanlış ezber: "Yedeklerimizi düzenli alıyoruz, yani tamamen güvendeyiz."
Gerçek: En büyük ve en sık düşülen tuzaklardan biridir. Sadece yedek almak yetmez. "Yedekten başarıyla ve hedeflenen sürede geri dönebiliyor musunuz?" sorusu kritiktir. Çoğu şirket kriz anında yedeklerin bozuk olduğunu veya veriyi geri yüklemenin (restore) günler süreceğini fark eder. Önemli olan sadece veriyi kurtarmak değil, RPO (veri kaybı limiti) ve RTO (hedef iş kurtarma süresi) dengesini canlı testlerle doğrulamaktır.
Örnek senaryo: Bir finans kurumu her gece düzenli yedek almaktadır. Bir fidye yazılımı (ransomware) saldırısı sonrası sistemleri kilitlenen şirket, yedeklere güvenerek rahattır. Ancak yedekleme kodundaki bir hata nedeniyle son 6 aylık yedeklerin "boş/0 KB" olarak kaydedildiği ve hiç test edilmediği ortaya çıkar. Şirket geçmişe dönük verilerini kaybeder.
3. Unutulmaya yüz tutan dokümanlar
Yanlış ezber: "Bizim çok detaylı, 200 sayfalık bir iş sürekliliği dokümanımız var, her şeye hazırız."
Gerçek: Kriz anında panik ve kaos hakimdir. Hiç kimse 200 sayfalık teknik bir PDF'i açıp okumaz. Tozlu raflarda duran, kasalarda veya dijital klasörlerde unutulan planlar ölü planlardır. İş sürekliliği statik bir doküman değil, yaşayan, sürekli güncellenen, simülasyonu yapılan bir kültürdür.. Masa başında veya sahada test edilmemiş bir planın, kâğıt üzerinde kalan bir temenniden ibaret olduğunu söyleyebiliriz.
Örnek senaryo: Büyük bir lojistik firmasının genel müdürlük binasında yangın çıkar. Kriz koordinatörleri, dokümanda belirtilen alternatif binaya giderler. Ancak binanın 2 yıl önce boşaltıldığı ve içindeki internet altyapısının söküldüğü kriz anında fark edilir çünkü doküman 3 yıldır güncellenmemiştir.
4. "Bu iş sadece iş sürekliliği bölümlerinin ve teknoloji iş birimlerinin görevidir" yanılgısı
Yanlış ezber: "İş sürekliliği sadece iş sürekliliği bölümlerinin ve teknoloji iş birimlerinin sorumluluğundadır."
Gerçek: BT ekibi sadece sistemleri ve altyapıyı ayağa kaldırır. Peki sistemlerin kapalı olduğu o saatler boyunca hazine nakit akışı nasıl yönetilecek? Çağrı merkezi öfkeli müşterilere ne diyecek? İnsan Kaynakları çalışan güvenliğini nasıl koordine edecek? İş sürekliliği, şirketin tüm departmanlarının ortak icra ettiği bir senfonidir.
Örnek senaryo: Bir şirketin ana veri tabanı çöker. BT ekibi başarılı bir süreç yöneterek harıl harıl sistemi ayağa kaldırmaya çalışırken, iç iletişim sağlıklı çalışmamış, çağrı merkezi ekibine bilgi verilmemiştir. Çağrı merkezindeki çalışanlar ne diyeceğini bilemeyip müşterilere çelişkili açıklamalar yapınca sosyal medyada "şirket battı" dedikodusu yayılır ve kriz bir anda finansal bir itibar felaketine dönüşür.
5. Sadece makro felaketlere odaklanmak
Yanlış ezber: "Deprem, yangın, sel gibi büyük doğal afetlere hazırlıklı olsak yeter."
Gerçek: Günümüzde şirketleri durduran veya iflasa sürükleyen şeyler genelde büyük coğrafi felaketler değil, mikro krizlerdir. Hatalı bir kod güncellemesi, kritik bir çalışanın aniden işten ayrılması veya kritik bir yazılım tedarikçisinin siber saldırıya uğraması operasyonları anında durma noktasına getirebilir.
Örnek senaryo: Bir hava yolu şirketi, uçuş planlama yazılımına gelen çok küçük ve rutin bir güncelleme (yama) sonrasında tüm sistemlerin kilitlenmesiyle karşı karşıya kalır. Büyük bir depreme karşı mükemmel yedek merkezleri olan şirket, bu basit yazılım hatası yüzünden 3 gün boyunca hiçbir uçağını kaldıramaz ve binlerce yolcu havalimanlarında mahsur kalır.
6. Üçüncü parti (tedarikçi) risklerini atlamak
Yanlış ezber: "Şirketin kendi sistem ve altyapısı tamamen yedekli ve güvenli, operasyonumuz kesintiye uğramaz."
Gerçek: Şirket iç sistemlerinin mükemmel olması tek başına yeterli değildir. Çünkü operasyonlar, dışarıdan alınan SaaS hizmetlerine, veri merkezi sağlayıcılarına, kargo şirketlerine veya ödeme geçitlerine (payment gateway) bağlıdır. Tedarikçi iş sürekliliği risk analizi yapılmadıysa, zincirin en zayıf halkası kadar güvendesiniz demektir.
Örnek senaryo: Bir fintech şirketi, tüm altyapısını kusursuz kurgulamıştır. Ancak kullanıcıların sisteme giriş yaparken SMS doğrulama kodu (OTP) almasını sağlayan dış tedarikçi SMS operatörü siber saldırıya uğrar. Fintech şirketinin sistemlerinde bir sorun olmamasına rağmen hiçbir müşteri sisteme giriş yapamaz ve operasyon tamamen durur.
7. "Evden çalışma" rahatlığı
Yanlış ezber: "Ne de olsa evden çalışılabiliyor, ofis zarar görse bile herkes evden devam eder."
Gerçek: Uzaktan çalışma harika bir esneklik ancak kriz anında evlerin de güvenli ve erişilebilir olduğu varsayımı tehlikelidir. Geniş çaplı bir elektrik kesintisinde, bölgesel internet altyapısının çökmesi durumunda veya siber saldırı sonucu şirketin VPN sunucularının devre dışı kalması durumunda evden çalışma senaryosu anında çöker.
Örnek senaryo: Bir şehrin ana internet omurgasında büyük bir arıza meydana gelir. Şirket çalışanlarının %80'i aynı bölgede yaşadığı için hiçbir çalışan sisteme bağlanamaz. Şirket, bağımsız enerji ve internet hattına sahip alternatif bir çalışma merkezi planlamadığı için iş üretemez hale gelir.
8. Her şeyi "kritik" tanımlamak
Yanlış ezber: "Biz büyük bir şirketiz, her şey kritik. Kriz anında tüm sistemler aynı anda ayağa kalkmalıdır."
Gerçek: Kriz anında kaynaklar (insan gücü, bant genişliği, finans, zaman) kısıtlıdır. Her şeyi aynı anda kurtarmaya çalışmak, hiçbir şeyi kurtaramamakla sonuçlanır. İş sürekliliği yönetiminin temeli iş etki analizi yaparak süreçleri kritiklik derecesine göre katmanlara ayırmaktır. Önce şirketin can damarları ayağa kaldırılır.
Örnek senaryo: Bir hastane grubunun veri merkezi çöker. BT ekibi, hastaların ameliyat ve yoğun bakım takibini yapan hayati sistemleri ayağa kaldırmak yerine, gelen şikayetlerin yoğunluğundan dolayı, idari işlerin kullandığı "İnsan Kaynakları ve İzin Yönetim Sistemi”ni ayağa kaldırmaya öncelik verir. Bu sırada acil servisteki hastaların dijital kayıtlarına erişilemez ve tıbbi kriz yaşanır.
9. Paranın gücüne fazla güvenmek
Yanlış ezber: "En pahalı donanımları, en iyi replikasyon cihazlarını aldık, iş sürekliliği problemimizi çözdük."
Gerçek: İş sürekliliği bir yazılım veya donanım satın alma projesi değil, bir insan ve süreç yönetimidir. En pahalı sistem bile, kriz anında o sistemi yönetecek çalışanların panik yapması, şifreyi unutması, görev tanımını bilmemesi veya iletişim koptuğu için birbirine ulaşamaması durumunda işlevsiz hale gelir.
Örnek senaryo: Bir üretim fabrikası, milyon dolarlık kesintisiz güç kaynakları (UPS) ve jeneratör sistemleri kurar. Şehir şebekesinde büyük bir voltaj dalgalanması yaşandığında jeneratörler devreye girmez. Çünkü jeneratörün otomatik devreye girme anahtarını manuel moda alan teknisyen o gün izinlidir ve diğer çalışanlar panodan bu ayarı nasıl değiştireceklerini bilmemektedir. Milyon dolarlık yatırım, süreç ve insan yetkinliği eksikliği yüzünden işe yaramaz.
10. "Cumartesi gecesi" testleri
Yanlış ezber: "Yılda bir kez cumartesi gecesi planlı test yapıyoruz, başarıyla geçiyoruz. Demek ki hazırız."
Gerçek: Önceden duyurulmuş, herkesin hazırlık yaptığı, sakin bir hafta sonu gece yarısı yapılan planlı testler gerçek olgunluk seviyesini göstermez. Gerçek krizler salı günü saat 14.00'te, en yoğun iş trafiğinin ortasında, habersizce gelir.
Örnek senaryo: Bir aracı kurum, her yıl planlı olarak pazar günleri yedek merkeze geçiş testi yapmaktadır. Ancak bir çarşamba günü saat 11.00'de piyasalar açıkken ana sistem çöker. Canlı trafik altındaki yük nedeniyle yedek merkeze geçiş prosedürleri çalışmaz çünkü pazar günkü testlerde hiçbir zaman "gerçek kullanıcı yükü” simüle edilmemiştir. Şirket ciddi yasal cezalarla karşı karşıya kalır.
İş sürekliliği mimarinizde, bu 10 ezberden en az birini şirketinizde gözlemliyorsanız operasyonel dayanıklılık için yeni bir yol haritasına ihtiyacınız var demektir. İş sürekliliğinin "Başımıza bir şey gelirse ne yaparız?" dokümanı olmadığını; "Başımıza her an bir şey gelebilir. O anı en az hasarla nasıl yönetir ve paydaşlara verdiğimiz sözü taahhütleri kesintisiz şekilde nasıl yerine getirmeye devam ederiz?" felsefesi olduğunu akılda tutmak çok önemli.