Pasif node da public kabloyu çekince failover olmayabilir

Örnegin Windows Server 2008 R2 de iki node lu bir failover cluster kuruyorsunuz. Iki network kullaniyorsunuz. Birini dedicated private yapiyorsunuz ("allow clients to connect through this network" check degil) ve diger public networkü all communications olarak birakiyorsunuz (private+public).

Simdi, private kabloyu aktif node da çekdiginizde bir sey olmasini beklemeyiz, çünkü heartbeatler diger node dan da gidebilirler. Ancak aktif node da (cluster grubun çalistigi) public networkün kablosunu çektiginizde cluster IP si fail ediyor olabilir. Üstüne IP yi move edemiyor olabilirsiniz; yani kabloyu geri takana kadar IP online olmuyor olabilir.

‘Cluster log /g’ komutu ile C:\Windows\Cluster\Reports altinda cluster logunu olusturdugunuzda aktif node un cluster logunda sorunun fark edildigini ama failover yapilmadigini görebiliyor olabilirsiniz. Eger bu hatayi görüyorsaniz çözümü kolay:
WARN [RCM] Not failing over group Cluster Group, failoverCount 2, failover threshold 4294967295, nodeAvailCount 1.

‘cluster group "cluster group" /prop FailoverThreshold=99’ komutunu girdikten hemen sonra testi tekrarlayabilirsiniz ve cluster grubu failover edecektir. Baska gruplar ile ayni sorun olusuyorsa onlar için de ayni komutu dogru grup ismi ile tekrarlamaniz yeterli olacaktir.

Basar Güner
Sr. Support Engineer, Microsoft
https://www.microsoft.com/surface/en/us/default.aspx
https://cdn-smooth.ms-studiosmedia.com/news/mp4_mq/06182012_Surface_750k.mp4