Business Continuity and Minimizing Downtime
Merhaba,
Downtime’ın planlı veya plansız olması önemli maaliyetleri beraberinde getirir. Planlı veya Plansız kesintilerin önlemini almak sadece bir katmanda olmaz hiçbirzaman. Eğer sanal ortamda bunun önlemini alacaksanız, storage, san switch, networking alanlarında çeşitli yatırımlara gitmeniz gereklidir. Eğer fiziksel ortamda bunun önlemini alacaksanız bu yatırım dahada fazla olacaktır. Sanallaştırma katmanında olduğu gibi fiziksel katmandada storage, san switch, networking yatırımlarına gidip ek olarak sunucunun yedekliliğini sağlamak için fiziksel makina yatırımına gitmeniz gereklidir.
Fiziksel bir sunucudaki downtime’i minimum’ a indirmek veya ortadan kaldırmak bir hayli maaliyetlidir. Ancak VMware’in yazılımı ile daha ucuza bunu gerçekleştirebilir ve bu sayede önemli uygulamalarınızın downtime risk’ini minimum’a indirebilirsiniz.
vSphere aşağıdaki özellikleri bize sağlar;
- Genel bakım işlemleri için downtime’i minimum’a indirir.
- Failure durumunda otomatik recovery sağlar.
- High availability için, donanım ve işletim sistemi birbirinden bağımsızdır.
Reducing Planned Downtime:
Planlı kesintiler genellikle datacenter kesintilerinin %80’ini oluşturuyor. Donanım bakımı, server migration ve firmware update’leri için fiziksel sunucularda downtime gereklidir. Tabi downtime’i minimum’a indirmek içinde firmalar genellikle bakım,migrate,update gibi işlemleri ertelemek durumunda kalıyor.
vSphere, firmaların planlanan arıza sürelerini minimum’a indirir. Planlı çalışma esnasında, ESXi host’lar üzerinde çalışan virtual machine’leri farklı host’lara migrate ederek host’u maintenance’a alabiliriz. Bu süre içerisinde de virtual machine’ler farklı host’lar üzerinden hizmet vereceği için herhangi bir kesinti oluşmayacaktır.
vSphere ile;
- Sunucu üzerindeki bakım işlemleri için kesintiyi ortadan kaldırırsınız.
- Kullanıcıları ve hizmetleri aksatmadan bakım işlemlerini gerçekleştirebilirsiniz.
vSphere vMotion ve Storage vMotion özellikleri ile VMware ortamında çalışan virtual machine’leri hizmet kesintisi olmadan yerlerini değiştirebilirsiniz. vMotion ve Storage vMotion ile ilgili detaylar öğrenmek için aşağıdaki link’leri inceleyebilirsiniz.
https://www.tayfundeger.com/storage-vmotion-svmotion.html
https://www.tayfundeger.com/vmotion-part-1.html
https://www.tayfundeger.com/vmotion-part-2.html
Preventing Unplanned Downtime:
Bir ESXi host üzerinde çalışan virtual machine’leri eğer HA aktif ise korur. Downtime risk’ini minimum’a indirir. Ancak Plansız downtime işin içine girdiğinde herşey sanallaştırma katmanında bitmiyor. Evet vSphere sizin kesintilerinizi minimum’a indirir ancak burada datacenter’ınızında altyapısı önem arzediyor.
vCenter üzerinde HA enable edildiğinde, virtual machine’lerin işletim sistemlerine bakılmaksızın inventory içerisinde bulunan bütün virtual machine’ler protect duruma gelir. HA ile ilgili detaylı bilgiyi aşağıdaki link’den öğrenebilirsiniz.
https://www.tayfundeger.com/vmware-ha-nasil-calisir
https://www.tayfundeger.com/testing-vsphere-ha.html
vSphere HA’i enable ettiğinizde evet virtual machine’leri sanallaştırma katmanında protect duruma alıyorsunuz. Yani host’un birtanesinin down olması durumunda vCenter, virtual machine’i başka bir host üzerinde otomatik olarak power on hale getirecektir. Peki downtime’i minimum hale getirmek için sanallaştırma katmanı dışında nelere dikkat etmeliyiz?
Shared Storage: Fibre Channel, ISCSI SAN veya NAS kullanıyorsanız, tek bir noktada virtual machine dosyalarınız toplamayın. SAN mirroring ve replication özelliklerini kullanarak virtual disk dosyalarını yani vmdk’ları disaster recovery site’iniza gönderin. Tabi eğer sizin kullanmış olduğunuz storage 2 tane ve birbirlerine replike durumda ise bu durumda zaten yedekliliği sağlamış durumdasınızdır. Tabi bu dediğim sadece storage tarafı için geçerli.
Yukarıdaki örnek topolojiyi incelediğimizde. 2 SAN switch olduğunu ve bunların kendi aralarında yedekli olduğunu görüyoruz. ESXi host’lar üzerinde 2 şer HBA olduğunu ve bunların yedeklilik sağlaması açısından çapraz bir şekilde SAN Switch’lere bağlandığını görüyoruz. Disk array tarafında ise işlem birazdaha farklı. Yukarıda ki örnekte, tek bir disk üniteniz var ve bunun önünde 2 tane controller var. SP = Storage Processors. Her bir controller’da SAN Switch’e çapraz bir şekilde bağlandığını görüyoruz.
Yukarıdaki topoloji tam redundant bir yapıyı örnekler.
Storage Multipathing: Yukarıdaki topolojide SAN Switch’e çapraz bir bağlantı yaptık. Her host hem SAN Switch A hemde SAN Switch B ‘ye bağlantığı için path’lerin yedekliliği sağlanmıştır.
Network interface teaming: Hostlar üzerinde single port yerine dual port network kartı kullanarak, network kartında oluşacak donanım arızasına karşı önlem alın. Host üzerinde bulunan uplink’lerin her birini farklı bir switch’e takmalısınız. Yukarıdaki topolojide 2tane Catalyst switch olduğunu görüyoruz. Her host’da bulunan 2 network kartını çapraz bir şekilde switch’lere bağlamalısınız. Böylece network altyapınız da yedekliliği sağlamış olursunuz.
Burada belirttiğim özelliklere ek olarak vSphere HA ve Fault Tolerance sayesinde hata riskini minimum’a indirebilirsiniz.
vSphere Fault Tolerance Provides Continuous Availability:
Yukarıda da bahsettiğim gibi vSphere HA, host’un arızalanması durumunda devreye girer ve host üzerinde bulunan virtual machine’leri farklı bir host üzerinde reboot ederek açar. vSphere ile birlikte gelen bir diğer ise vSphere Fault Tolerance özelliğidir. Bu özellik bir virtual machine üzerinde aktif edildiğinde bu virtual machine’in bir kopyası farklı bir host üzerinde shadow olarak oluşturulur. vSphere Fault Tolerance nasıl çalıştığını aşağıdaki linkden görebilirsiniz.
https://www.tayfundeger.com/vmware-vsphere-fault-tolerance-simulasyon.html
https://www.tayfundeger.com/whats-new-in-vsphere-6-0-fault-tolerance.html
Fault Tolerance tamamen donanım yedekliliği sağlar. Fault Tolerance’ın aktif edilmesi durumunda virtual machine’in barındığı host’un down olması durumunda diğer host üzerinde çalışan shadow virtual machine üzeirnden kesintisiz bir şekilde işleme devam edilir. Zaten yukarıdaki simulasyonda’da bunu detaylı olarak görebilirsiniz. Fault tolerance yanlızca donanım yedekliliği sağlar. İşletim sistemi içerisinde çalışan uygulama eğer herhangi bir sebebden dolayı crash olursa aynı anda diğer host üzerinde çalışan shadow virtual machine içerisindede crash olacaktır. Buna çok dikkat etmelisiniz.
Fault tolerance arka planda vLockstep teknolojisini kullanır. Primary virtual machine, işlemciden virtual I/O device’lara giden bütün olayları capture eder ve bunları Secondary virtual machine’e aktarır. Fault Tolerance’da virtual machine’in birebir bir kopyası shadow olarak çalıştırıldığından Primary’nin down olması durumunda Secondary direk devreye girecektir. Bu süre zarfında asla kesinti olmaz.
Umarım faydalı olmuştur.
İyi çalışmalar.