Nutanix – Health Dashboard
Merhaba,
Eğer bir Nutanix kullanıyorsanız yapınızda olup-bitenden kısa bir süre içerisinde haberdar olabilirsiniz. Çoğu zaman VMware ortamındaki utilization oranlarını görebilmek için Performance monitor , vRealize Operations Manager, VeeamOne veya VMturbo gibi ürünler kullanmak durumunda kalıyoruz. Tabi bu ürünlerin kurulması konfigurasyonlarının yapılması ayrıca zamanımızı alıyor. Nutanix, Hyperconverged bir mimari olduğu tek bir ekrandan bütün detayları yönetmenize ve görmenize olanak sağlıyor. Nutanix Prisim‘de bulunan Health dashboard’ı sayesinde Nutanix üzerinde olup biten herşeyden haberimiz oluyor. Hemen hemen bütün ürünlerde Heatlh diye bir bölüm vardır. Ancak bu bölümde genel olarak ürünün donanımsal arızaları vs gösterilir. Nutanix’de Health bölümü biraz farklı. Health bölümüne girdiğinizde Nutanix Cluster’ında bulunan hataları uçtan uca görebiliyorsunuz. Health bölümüne giriş yaptığınızda aşağıdaki bölümler’deki donanım ve konfigurasyon hatalarını tek tek görebiliyorsunuz. Health bölümünde yer alan başlıklar aşağıdaki gibidir;
- VMs
- Hosts
- Disks
- Storage Pools
- Containers
- Cluster Services
Yukarıdaki başlıkları tek tek incelemenden önce kullanmış olduğum Nutanix hakkında da bilgi vermek istiyorum. 3 node’dan oluşan 2 soketli Intel Broadwell mimarisine sahip E5 2650 v4 işlemcili node’lar kullanıyorum. Her bir node üzerin de 6 tane SSD bulunuyor. Toplamda 18 SSD bulunuyor. Hypervisor olarak ESXi kullanılıyor ancak siz Nutanix ile birlikte isterseniz Hyper-V istersenizde Acropolis kullanabilirsiniz. Yani birden fazla opsiyon bulunuyor. Benim kullanmış olduğum Nutanix’de hypervisor olarak ESXİ kullanılmaktadır.
Yukarıda da bahsettiğim gibi eğer siz ortamınızda VMware vCenter / ESXi kullanıyorsanız inventory içerisinde bulunan virtual machine’lerde, datastore’da, network’de herhangi bir sorun olup olmadığını bir bakışta anlayamazsınız. Bunun için ekstra tool’lar kurmanız gerekir. Tabi performance metric’leri konusunda ileri seviye bir bilgiye sahipseniz bu tarz tool’lara bile gerek yok. Nutanix’de ise böyle bir ihtiyaç bulunmuyor. Nutanix Cluster’ımızın durumu nasıl? Bunun detaylarını inceleyelim.
Not: Node’lar üzerinde bulunan virtual machine’lerde benchmark tool’ları çalıştırdım. Böylece Health bölümünde değerleri daha detaylı olarak görebiliriz.
Yukarıdaki dashboard’a ilk baktığınızda biraz karışık gelebilir. Health bölümü 6 başlıktan oluşuyor. Ancak bu 6 başlık kendi altında çeşitli bölümlere ayrılıyor. Burada değerler Failures, Warning ve Successes olarak izlenmektedir. Ben ilk olarak burada VMs tab’ını inceleyeceğim.
Nutanix Cluster’ımda toplamda 15 tane virtual machine bulunuyor. Yukarıdaki ekran görüntüsünde de görüleceği üzere bazı değerler üzerinde Warning’ler bulunuyor.Bu warning’lerin neden oluştuğunu bulmak çok kolay. Ekranın sağ tarafındaki bölümden nerede sorun olduğunu kolayca görebilirsiniz. Benim kullanmış olduğum yapıda CPU Utilization’da warning bulunuyor. Bunun sebebi ise, Health değerlerini daha detaylı görebilmek için 15 tane virtual machine içerisinde CPU benchmark tool’u çalıştırdığım için bu şekilde gözüküyor. Virtual machine’lerin tüm CPU’ları %100 çalıştığı için Health bölümü Warning oluşturuyor. Eğer virtual machine’lerin CPU utilization oranı %90’ı aşıyor ise karşınıza warning olarak çıkartıyor. Warning olan metric’e giriş yaptığımızda aşağıdaki gibi bir ekran ile karşılaşıyoruz.
Görüldüğü gibi virtual machine’lerin günlere göre CPU kullanımları mevcut. Her bir virtual machine’in detaylarınıda ayrıca görebilirsiniz. Bunun için virtual machine ismine tıklamanız yeterli. Ayrıca ekranın sağ tarafında bu hatanın neden kaynaklandığı ve nasıl çözüleceği konusunda da bilgi alabilirsiniz. Eğer bu warning’leri görmek istemiyorsanız Turn Check Off butonuna basabilir veya Parameters bölümünden VM PEAK CPU UTIL THRESHOLD PCT değerini değiştirebilirsiniz. Ben Cpu Utilization değerini Turn Check Off yapacağım. Böylece Health bölümünde CPU Utilization değerini birdaha görmeyeceğim.
Hosts tab’ında ESXi host’lara ait detayları görüyoruz. Burada işlerin kolaylaştırılması için çeşitli sekmeler bulunuyor. Örneğin Storage Capacity yani datastore boyutu’nun 1.5 TB’den büyük kaç host, üzerinde 50-100VM olan kaçtane host, Memory kapasitesi 150GB’den fazla kaç host olduğunu görebilirsiniz. Yine işlemlerin daha kolaylaştırılması için bu değerleri dışarıya export olarak çıkartabilirsiniz. Böylece çeşitli script’ler ile uğraşmayıp hızlıca işinizi halledebilirsiniz.
Host’lar üzerindeki yük durumlarını hangi host üzerinde nekadar vm olduğu detaylarının hepsini tek tek not etmenize gerek bulunmuyor. Veya bu detayları almak için script ile uğraşmanıza gerek bulunmuyor. Bunları toplu bir şekilde kayıt etmek için Export CSV veya Export JSON ‘u kullanabilirsiniz.
Disk tab’ında karşımıza Disk Usage, Disk Capacity, Health başlıkları geliyor. Buradaki bölümden fizksel disk’lerde oluşan bir sorunu görebilirsiniz. Disk’in arızalanması veya bir sebepden dolayı fail olması durumunlarını görebilirsiniz. Nutanix Cluster’ınızda bulunan datastore’ların usage miktarlarını yüzdelik dilimlerde görebilirsiniz. Disk capacity bölümünü zaten üstteki yazılarımda anlatmıştım.
Storage Pool tab’ında mevcut storage pool’unuzun doluluk oranlarını görebilirsiniz. Aynı şekilde Storage pool sayesinde oluşturmuş olduğumuz Container’lerinde space durumlarını Container tab’ında görebilirsiniz.
Cluster services bölümünde genel olarak Nutanix Cluster’ında olup bitenleri görebilirsiniz. Ben kullanmış olduğum Nutanix Cluster’ında SMTP konfigurasyonunu yapmadım. Bundan dolayı Health bölümünde Failures bir alert oluşturdu. Zaten sağ tarafta bulunan bölümden hangi bileşenleri kontrol ettiğini görebilirsiniz.
Son olarak yazının başında da bahsettiğim gibi, Health Dashboard bölümü bize oldukça detaylı bilgi veriyor. Aslında Nutanix kullanan kişilerde beni doğrulayacaktır, sadece Health bölümüne bakarak bile sistemin doğru ve kararlı bişekilde çalıştığını görebilirsiniz. Birden fazla metric olduğu için en ufak detayı bile burada görebilirsiniz.
Umarım faydalı olmuştur.
iyi çalışmalar.