Test HA

On a un cluster avec plusieurs ESX, mais une VM ne peut s’exécuter que sur un seul (exception pour les machines FT Fault Tolerance)

En cas de maintenance ou d’arrêt prévu d’un ESX, via vMotion on peut déplacer les VMs sur un autre ESX.
C’est une opération planifiée.
Que se passe t’il en cas de crash d’un ESX ??

C’est vSphere HA qui va gérer la situation, il va détecter la panne puis redémarrer les VMs impactées automatiquement (coupure de service, les VMs HS redémarrent)
Il y a la possibilité de régler les priorités de démarrage, de ne pas redémarrer automatiquement une VM….
On va juste tester le fonctionnement, je vous laisse creuser le sujet avec les pdfs de VMware ou d’autres blogs…

On reprend notre VM que l’on déplace à nouveau afin de la mettre sur SRV-ESX2
J’ai volontairement arrété la VM SRV-TEST2 car elle se trouve sur le datastore local de l’ESX et n’est donc pas accessible depuis SRV-ESX1.

On vérifie que le cluster est en bonne santé et que HA est actif.
2016-03-15_152651

C’est parti, on arrête électriquement SRV-ESX2 afin de simuler un véritable crash avec les VMs qui sont en train de s’exécuter.2016-03-15_152718

On commence à avoir des signes que quelque chose ne va pas, SRV-ESX2 ne répond plus trop…2016-03-15_152742

HOUSTON ??, on a un problème SRV-ESX2 est passé dans la matrice….2016-03-15_152818

Roger, Roger, HA a bien détecté le problème.
Il décide de basculer automatiquement la VM2016-03-15_152843

La VM est de nouveau opérationnelle, quelques minutes on suffit.
On constate qu’elle est revenue sur SRV-ESX12016-03-15_152946

On lance la console et on voit que l’OS a redémarré
2016-03-15_153032

Par contre on a perdu SRV-ESX2 et SRV-TEST2 qui est arrêté mais qui est surtout inaccessible !!2016-03-15_153116

Petit quiz surprise: est ce que sur le screen de la VM SRV-LUBUNTU, il n’y a pas un truc bizarre, sachant qu’aujourd’hui nous sommes le 15 mars 2016….
C’est la date !!!!
C’est quoi cette embrouille ???
Cela met en évidence un point extrêmement important dans un cluster VMware.
Il faut absolument que tous les ESX soient à la même heure, il est d’ailleur fortement conseillé d’utiliser un NTP.
En effet, via les VMware Tools, les VMs récupèrent l’heure de l’ESX pour leurs propres horloges. Les VMs pouvant se déplacer d’un ESX à l’autre, en cas de décalage, cela peut avoir de lourdes conséquences:
Fichiers de logs qui n’ont pas la bonne heure…
Pb d’authentification sur les ADs…
Pb applicatifs…..
Si on regarde les dates des ESX on voit bien le problème !!

SRV-ESX1 n’est pas du tout à la bonne date!!!!
Il est au 14 avril, c’est la date de naissance de Katsuhiro Ōtomo l’auteur d’Akira et le jour de la St Maxime….coincidence ??….ou pas en fait !!!!
2016-03-15_163908

2016-03-15_163957

Avec vMotion, on peut manuellement déplacer les Vms d’un ESX à l’autre.
HA permet de redémarrer les VMs en cas de perte d’un ESX.

—————————————————–
On va maintenant voir comment on peut déplacer la VM et son stockage
Cette fonction se nomme
Storage vMotion
—————————————————–