1.6.1 La fiabilité
La fiabilité (reliability) est définie comme la probabilité qu’un objet réalise la fonction requise dans les conditions établies pendant une période de temps donnée [3]. L’évaluation et la réalisation d’un niveau de fiabilité devient alors un problème très complexe [4].
Des études récentes sur la fiabilité des systèmes ont été réalisées dans le but de mettre en place des mécanismes de tolérance aux fautes afin d’augmenter le temps moyen jusqu’à la première panne MTTF (Mean Time To Failure) [5] [6].
1.6.2 La maintenabilité
La notion de maintenabilité (maintenability) va au-delà de la simple réparation ou changement des composants défaillants du système. En effet, elle peut aller de la prédiction de défaillances jusqu’à l’amélioration du système, en passant par la prévention des fautes. En définitive, la maintenabilité se conçoit comme la mesure de temps entre la dernière défaillance survenue et la restauration du système (transition de service incorrect à service correct) [7]. Un exemple de mesure de maintenabilité est le MTTR (Mean Time To Repair), le temps moyen de réparation ou de restauration du système dans l’état du bon fonctionnement.
1.6.3 La disponibilité
La disponibilité (availability) définit le fait que le système soit prêt à l'utilisation, ce qui importe, c'est que le service correct soit fourni au moment où l'utilisateur en a besoin [9] [10]. La disponibilité est une mesure sans unité, elle correspond à la proportion du temps de bon fonctionnement sur le temps total d'exécution du système. La disponibilité est tributaire à la fois de la fiabilité et de la maintenabilité.
1.6.4 La sûreté
La sûreté (safety) respecte la non occurrence de défaillance catastrophique [9], [10]. C'est-à-dire celles pour lesquelles les conséquences sont inacceptables vis-à-vis du risque encouru par les utilisateurs du système. Accroître la sécurité d'un système peut parfois se faire au détriment de sa disponibilité. Dans le cas d'une centrale nucléaire, par exemple : L’arrêt d'un réacteur pour éviter la fusion du cœur.
1.6.5 La sécurité–confidentialité
La sécurité (security), prévoit la non occurrence des accès des utilisateurs non autorisés ou l'acquisition non autorisée des informations [9],[10], ou de façon plus générale, si la préoccupation essentielle est de lutter contre les fautes intentionnelles (virus, bombes logiques, chevaux de Troie,...).
La fiabilité, la disponibilité et la sûreté innocuité relèvent du domaine de la tolérance aux fautes, la dernière propriété concerne les attaques. Les propriétés sur lesquelles repose la sûreté de fonctionnement peuvent être considérées de manière indépendante mais elles sont étroitement liées [14].
1.7 Entraves à la sûreté de fonctionnement
Lors du développement d’un système informatique (distribué ou non), des fautes peuvent être introduites au cours de sa conception et/ou de son implémentation sans être corrigées lors de la phase de validation. Les erreurs correspondantes restent latentes pendant la durée de vie du système jusqu’à ce qu’elles soient activées. Par exemple, dans le système de gestion d’archivage du véhicule martien SPIRIT, l’oubli de la libération de l’espace mémoire après l’envoi des images sur la terre qui représente une erreur latente n’a été activée que lorsque le système d’acquisition avait saturé la zone de stockage des données, ceci a conduit à deux semaines d’indisponibilité.
1.7.1 Le passage de la faute à l’erreur
L'origine d'une erreur est une faute, qui dans la plupart des cas est d'ordre conceptuel ou physique. En d'autres termes, on peut souvent ramener l'origine d'une erreur à une faute humaine au niveau de la conception d'un système ou d'une faute physique d'un composant matériel, et ce, de façon causale. L’activation d’une erreur d’un composant d’un système distribué peut affecter le service qu’il rend, auquel cas le composant est déclaré défaillant.
Par ailleurs, la défaillance d’un composant représente une faute auprès d’autres composants du système avec lesquels il interagit. Les défaillances, les erreurs et les fautes représentent les entraves à la sûreté de fonctionnement.
Les entraves à la sûreté de fonctionnement sont les circonstances indésirables mais inattendues causes ou résultats de la non sûreté de fonctionnement. Dans l’ensemble des entraves, on distingue comme cela a déjà été dit, la défaillance du système qui survient lorsque le service délivré dévie de l’accomplissement de la fonction du système. L’erreur est la partie de l’état de système qui est susceptible d’entraîner une défaillance, et enfin la faute est considérée comme la cause adjugée ou supposée de l’erreur, illustration dans la figure 2.
Figure 2 [15] : Faute, erreur et défaillance.
1.7.2 La propagation des fautes
Un système est usuellement composé d'autres systèmes plus petits, qui lui délivrent leurs services, ou, est toujours en interaction avec d’autres systèmes. La défaillance d'un de ces systèmes devient alors une faute pour les autres. Voici comment se fait la propagation ou la transitivité de l’erreur dans la figure 3.
Figure 3[15] : La Propagation des fautes, erreurs et défaillances.
1.8 Moyens assurant la sûreté de fonctionnement
1.8.1 La prévention des fautes
Elle vise à empêcher l’occurrence ou l’introduction de fautes [8], [11]. Elle consiste à développer des systèmes informatiques de telle façon à éviter d’introduire des fautes de conception, et à empêcher que les fautes ne surviennent en phase opérationnelle.
1.8.2 La tolérance aux fautes
Elle correspond à un ensemble de moyens, destinés à assurer qu’un système remplit sa fonction en dépit des fautes [8], [10], [11]. Elle cherche à éviter que les fautes présentes dans le système n’engendrent des défaillances en phase opérationnelle. Les techniques associées ont pour but de compenser l’occurrence d’erreur en utilisant par exemple des méthodes basées sur la duplication de matériel ou logiciel (N-version) ou de traiter l’erreur (Reprise).
Dostları ilə paylaş: |