NSX 6.2 Communication Healthcheck
Merhaba,
NSX 6.2 ile birlikte Communication Channel Health adında güzel bir feature geldi. Bu feature sayesinde NSX Manager ve Controller’lar (Cluster veya ESXi host) arasında yaşanan iletişim sorununu troubleshoot edebileceğiz.
NSX 6.2 kullanan kullanıcılar artık NSX Manager ile control plane agent (netcpa) ve firewall agent’ı arasındaki iletişimi kontrol edebilecekler. Eğer bu iletişim kopar ise NSX Manager recover için sync işlemi gerçekleştirecektir.
- NSX Manager to Firewall agent: Her 3 dakikada bir heartbeat gönderilir. Eğer 2 defa cevap gelmez ise sync işlemi başlatılır.
- NSX Manager to Control Plane Agent: Her 2 dakikada bir heartbeat gönderilir. Eğer 2 defa cevap gelmez ise sync işlemi başlatılır.
- Host to controller: Her 30 saniyede bir heartbeat gönderilir. Eğer 2 defa cevap gelmez ise sync işlemi başlatılır.
Aşağıdaki diagram’ı bir VMware sunumundan aldım. Burada NSX‘in ESXi host’lar ile olan ilişkisini görebilirsiniz.
NSX tarafından yönetilen tüm host’larda ve cluster’larda VSFWD isimli Firewall Agent ve NETCPA isimli Network Control Plane agent’i çalışır. Öncelikle Communication Channel Health feature’i için vSphere Web Client ‘a bağlanıyoruz. Networking & Security plug in > Installation > Host Preparation bölümüne giriş yapıyoruz.
NSX Manager’i seçtikden sonra Actions tab’ından Communications Channel Health ‘i seçiyoruz.
Yukarıdaki ekrandan da görüldüğü gibi ESXi host’lar üzerindeki agent’ların hepsi şuanda çalışıyor. Senaryo gereği ESXi host üzerindeki netCP agent service’ini yani buda control plane agent’i, stop edeceğim. Bu durumda yukarıdaki status’da değişecektir.
[root@esxi01:/var/log] /etc/init.d/netcpad status netCP agent service is running [root@esxi01:/var/log] /etc/init.d/netcpad stop watchdog-netcpa: Terminating watchdog process with PID 35036 Memory reservation released for netcpa netCP agent service is stopped
Yukarıdaki komutlar ile netCP agent service’ini stop duruma getirdim. Şimdi Communication Channel Health’i tekrar kontrol ettiğimizde, NSX Manager to Control plane agent’in down durumda olduğunu göreceğiz. Tabi burada unutmamanız gereken bir nokta var. Heatbeat 120 saniyede bir gerçekleştiği için bu status’un değişmesi ortalama 4 dakikayı alacaktır.
NSX Manager to Control Plane Agent down durumda olduğu için Control Plane Agent to Controller’da buna bağlı olarak Unknown durumda olacaktır.
Ben yukarıda basit birşekilde Communication Channel Health hakkında bilgi verdim ve yine bunu basit bir şekilde simule ettim.
Umarım faydalı olmuştur.
İyi çalışmalar.