next up previous contents
suivant: Contraintes matérielles monter: HP MC/Service Guard précédent: Gestion de disques   Table des matières

Gestion d'erreurs

L'erreur la plus critique au sein du cluster est le Transfert Of Control (TOC), tous les packages sont ainsi transféré vers une autre machine, et celle-ci est arrêtée. Un TOC peut intervenir après plusieurs événements :

Lors d'une erreur système sur l'une des machines, les packages sont transférés vers un autre membre du cluster. Il est à noter que lors du rechargement d'un package, aucune information quant à l'état des processus n'est sauvée (les différents registres de la machine avant l'erreur); ainsi, les packages sont relancés comme il le serait la première fois. Cette condition implique que les applications doivent être elles-mêmes tolérantes aux éventuelles erreurs, qu'elles doivent d'elles-mêmes pouvoir redémarrer après ce genre d'incidents. Lors de la détection d'une erreur dans un package, celui-ci est arrêté par son Control Script avec le paramètre ``stop''.



User & 2004-03-31