Zuverlässigkeit
Im Systemtechnik, Zuverlässigkeit ist ein Maß für die eines Systems Verfügbarkeit, Verlässlichkeit, Wartbarkeitund in einigen Fällen andere Eigenschaften wie Haltbarkeit, Sicherheit und Sicherheit.[1] Im Echtzeit-Computing, Zuverlässigkeit ist die Fähigkeit, Dienstleistungen bereitzustellen, denen innerhalb einer Zeitperiode vertraut werden kann.[2] Die Service -Garantien müssen auch dann gelten, wenn das System Angriffen oder natürlichen Ausfällen ausgesetzt ist.
Das Internationale Elektrotechnische Kommission (IEC) über sein technisches Komitee TC 56 Entwickelt und pflegt internationale Standards, die systematische Methoden und Instrumente zur Bewertung und Verwaltung von Geräten, Diensten und Systemen in ihren Lebenszyklen bereitstellen. Die IFIP -Arbeitsgruppe 10.4[3] Bei "zuverlässiger Computer- und Fehlertoleranz" spielt eine Rolle bei der Synthese des Fortschritts der technischen Community auf diesem Gebiet und organisiert jedes Jahr zwei Workshops, um die Ergebnisse zu verbreiten.
Zuverlässigkeit kann in drei Elemente unterteilt werden:
- Attribute - Eine Möglichkeit, die Zuverlässigkeit eines Systems zu bewerten
- Bedrohungen - Ein Verständnis der Dinge, die die Zuverlässigkeit eines Systems beeinflussen können
- Meint - Möglichkeiten, die Zuverlässigkeit eines Systems zu erhöhen
Geschichte
Einige Quellen sind, dass in den neunzehn Teenagern in Dodge Brothers Automobile Printwerbung die Nachricht geprägt wurde. Aber das Wort geht vor dieser Zeit mit der Oxford Englisch Wörterbuch Finden Sie seine erste Verwendung im Jahr 1901.
Da das Interesse an Verwerfungsverträglichkeit und Systemzuverlässigkeit in den 1960er und 1970er Jahren zunahm, war die Zuverlässigkeit ein Maß für [x] als Maßnahmen von Verlässlichkeit kam, um zusätzliche Maßnahmen wie Sicherheit und Integrität zu erfassen.[4] In den frühen 1980er Jahren wählte Jean-Claude Laprie so aus Zuverlässigkeit als Begriff, der Studien zur Fehlertoleranz und Systemzuverlässigkeit ohne die Erweiterung der Bedeutung umfasst Verlässlichkeit.[5]
Das Gebiet der Zuverlässigkeit hat sich aus diesen Anfängen zu einem international aktiven Forschungsbereich entwickelt, das durch eine Reihe prominenter internationaler Konferenzen gefördert wird, insbesondere die Internationale Konferenz über zuverlässige Systeme und Netzwerke, das Internationales Symposium für zuverlässige verteilte Systeme und die Internationales Symposium für Software -Zuverlässigkeitstechnik.
Traditionell beinhaltet die Zuverlässigkeit für ein System Verfügbarkeit, Verlässlichkeit, Wartbarkeit Aber seit den 1980er Jahren, Sicherheit und Sicherheit wurden zu Zuverlässigkeitsmaßnahmen hinzugefügt.[6]
Elemente der Zuverlässigkeit
Attribute

Attribute sind Eigenschaften eines Systems. Diese können bewertet werden, um die allgemeine Zuverlässigkeit zu bestimmen Qualitative oder Quantitative Maße. Avizienis et al. Definieren Sie die folgenden Zuverlässigkeitsattribute:
- Verfügbarkeit - Bereitschaft für den korrekten Service
- Verlässlichkeit - Kontinuität des korrekten Service
- Sicherheit - Fehlen katastrophaler Konsequenzen für die Benutzer (n) und die Umgebung
- Integrität - Fehlen einer unsachgemäßen Veränderung des Systems
- Wartbarkeit - Fähigkeit zur einfachen Wartung (Reparatur)
Wie diese Definition vorschlug, sind nur Verfügbarkeit und Zuverlässigkeit durch direkte Messungen quantifizierbar, während andere subjektiver sind. Zum Beispiel kann die Sicherheit nicht direkt über Metriken gemessen werden, ist jedoch eine subjektive Bewertung, die die Anwendung von Beurteilungsinformationen erfordert, um ein Vertrauensniveau zu gewährleisten, während Zuverlässigkeit als Fehler im Laufe der Zeit gemessen werden kann.
Vertraulichkeit, d.h. Das Fehlen einer nicht autorisierten Offenlegung von Informationen wird auch verwendet, wenn die Sicherheit behandelt wird. Sicherheit ist ein Verbundwerk von Vertraulichkeit, Integrität, und Verfügbarkeit. Sicherheit wird manchmal als Attribut eingestuft [7] Die aktuelle Ansicht besteht jedoch darin, sie zusammen mit der Zuverlässigkeit zu aggregieren und die Zuverlässigkeit als zusammengesetzte Begriff als Zuverlässigkeit und Sicherheit zu behandeln.[2]
Praktisch verbessert die Anwendung von Sicherheitsmaßnahmen auf die Geräte eines Systems im Allgemeinen die Zuverlässigkeit, indem die Anzahl externer Ursprungsfehler begrenzt wird.
Bedrohungen
Bedrohungen sind Dinge, die ein System beeinflussen und einen Abfall der Zuverlässigkeit verursachen können. Es gibt drei Hauptbegriffe, die klar verstanden werden müssen:
- Fehler: Ein Fehler (der normalerweise aus historischen Gründen als Fehler bezeichnet wird) ist ein Defekt in einem System. Das Vorhandensein eines Fehlers in einem System kann zu einem Fehler führen oder nicht. Obwohl ein System einen Fehler enthält, kann es beispielsweise niemals dazu führen, dass dieser Fehler niemals auszuführen, sodass ein Fehler auftritt. und so zeigt sich dieser bestimmte Fehler nie als Versagen.
- Fehler: Ein Fehler ist eine Diskrepanz zwischen dem beabsichtigten Verhalten eines Systems und seinem tatsächlichen Verhalten innerhalb der Systemgrenze. Fehler treten zur Laufzeit auf, wenn ein Teil des Systems aufgrund der Aktivierung eines Fehlers in einen unerwarteten Zustand eintritt. Da Fehler aus ungültigen Zuständen generiert werden, sind sie ohne besondere Mechanismen, wie Debugger oder Debugg -Ausgabe in Protokolle, schwer zu beobachten.
- Ausfall: Ein Fehler ist in Zeit, in dem ein System ein Verhalten zeigt, das seiner Spezifikation widerspricht. Ein Fehler kann nicht unbedingt einen Fehler verursachen, beispielsweise kann eine Ausnahme von einem System ausgelöst werden, dies kann jedoch unter Verwendung von Fehlertoleranztechniken gefangen und behandelt werden, sodass der Gesamtbetrieb des Systems der Spezifikation entspricht.
Es ist wichtig zu beachten, dass an der Systemgrenze Fehler aufgezeichnet werden. Sie sind im Grunde Fehler, die sich an die Systemgrenze vermehrt haben und zu beobachtbar sind. Fehler, Fehler und Fehler arbeiten nach einem Mechanismus. Dieser Mechanismus ist manchmal als Fehler-Fehler-Failure-Kette bekannt.[8] In allgemeiner Regel kann ein Fehler, wenn er aktiviert ist Systemgrenze).[9]
Sobald ein Fehler aktiviert ist, wird ein Fehler erstellt. Ein Fehler kann auf die gleiche Weise wie ein Fehler wirken, indem er weitere Fehlerbedingungen erzeugen kann. Daher kann ein Fehler innerhalb einer Systemgrenze mehrmals ausbreiten, ohne einen beobachtbaren Fehler zu verursachen. Wenn sich ein Fehler außerhalb der Systemgrenze ausbreitet, soll ein Fehler auftreten. Ein Fehler ist im Grunde der Punkt, an dem gesagt werden kann, dass ein Dienst seine Spezifikation nicht erfüllt. Da die Ausgangsdaten eines Dienstes in einen anderen gefüttert werden können, kann sich ein Fehler in einem Dienst als Fehler in einen anderen Dienst ausbreiten, sodass eine Kette aus dem Formular gebildet werden kann: Fehler, der zu einem Fehler führt, der zu einem Fehler führt, was zum Fehler führt, usw.
Meint
Da der Mechanismus einer Verwerfungs-Erre-Kette verstanden wird, ist es möglich, Mittel zu konstruieren, um diese Ketten zu brechen und dadurch die Zuverlässigkeit eines Systems zu erhöhen. Bisher wurden vier Mittel identifiziert:
- Verhütung
- Entfernung
- Vorhersage
- Toleranz
Die Fehlerprävention befasst sich mit der Verhinderung, dass Fehler in ein System eingeführt werden. Dies kann durch die Verwendung von Entwicklungsmethoden und guten Implementierungstechniken erreicht werden.
Die Fehlerentfernung kann in zwei Unterkategorien unterteilt werden: Entfernung während der Entwicklung und Entfernung während der Verwendung.
Die Entfernung während der Entwicklung erfordert Überprüfung, damit Fehler erkannt und entfernt werden können, bevor ein System in die Produktion eingesetzt wird. Sobald Systeme in die Produktion gesteckt wurden, ist ein System erforderlich, um Fehler aufzuzeichnen und über einen Wartungszyklus zu entfernen.
Die Fehlervorhersage prognostiziert wahrscheinliche Fehler, damit sie entfernt werden können oder ihre Auswirkungen umgangen werden können.[10][11]
Fehlertoleranz befasst sich mit der Einführung von Mechanismen, die es einem System ermöglichen, den erforderlichen Service in Anwesenheit von Fehlern weiterhin zu erbringen, obwohl dieser Service möglicherweise auf einer verschlechterten Ebene liegt.
Zuverlässigkeitsmittel sind dazu gedacht, die Anzahl der für die Endbenutzer eines Systems sichtbaren Fehler zu verringern.
Beharrlichkeit
Basierend darauf, wie Fehler aussehen oder bestehen bleiben, werden sie als:
- Vorübergehend: Sie erscheinen ohne offensichtliche Ursache und verschwinden wieder ohne offensichtliche Ursache
- Zeitweise: Sie erscheinen mehrmals, möglicherweise ohne erkennbares Muster, und verschwinden alleine
- Permanent: Sobald sie erscheinen, werden sie nicht alleine gelöst
Zuverlässigkeit von Informationssystemen und Überlebensfähigkeit
Einige arbeiten zur Zuverlässigkeit [12] Verwenden Sie strukturiert Informationssysteme, z.B. mit Soa, um das Attribut vorzustellen Überlebensfähigkeitberücksichtigt die erniedrigten Dienste, die ein Informationssystem nach einem nicht maskierbaren Fehler aufrechterhält oder wieder aufnimmt.
Die Flexibilität der aktuellen Rahmenbedingungen ermutigt Systemarchitekten, Neukonfigurationsmechanismen zu ermöglichen, die die verfügbaren, sicheren Ressourcen neu ausführen, um die kritischsten Dienste zu unterstützen, anstatt zu überproduktiv zu sein, um ein fehlerhaftes System aufzubauen.
Mit der Verallgemeinerung vernetzter Informationssysteme, Barrierefreiheit wurde eingeführt, um der Erfahrung der Benutzer größere Bedeutung zu geben.
Berücksichtigung des Leistungsniveaus, die Messung von Performance ist definiert als "Quantifizierung, wie gut das Objektsystem in Gegenwart von Fehlern über einen bestimmten Zeitraum ausgeführt wird".[13]
Siehe auch
- Internationale Konferenz über zuverlässige Systeme und Netzwerke- Computernetzwerkkonferenz
- Fehlerinjektion- Testen, wie sich Computersysteme unter ungewöhnlichen Belastungen verhalten
- Fehlertoleranz- Resilienz von Systemen gegenüber Komponentenfehlern oder -fehlern
- Formale Methoden- Mathematische Programmspezifikation, die zur Ermöglichung von Korrektheitsergebnissen, einschließlich algorithmisch
- Liste der Systemqualitätsattribute-Nicht funktionale Anforderungen für die Systembewertung
- Widder- technische Charakterisierung eines Produkts oder Systems
- Zuverlässigkeitstechnik-Unterdisziplin der Systemtechnik, die die Zuverlässigkeit hervorhebt
- Sicherheitstechnik- technische Disziplin, die sicherstellt, dass technische Systeme ein akzeptables Sicherheitsniveau bieten
Weitere Lektüre
Papiere
- Wilfredo Torres-Pomales: Software -Fehlertoleranz: Ein Tutorial, 2002
- Stefano Porcarelli, Marco Castaldi, Felicita di Giandomenico, Andrea Bondavalli, Paola Inverardi Ein Ansatz zur Verwaltung der Rekonfiguration in fehlertoleranten verteilten Systemen
Konferenzen
- Internationales Symposium über zuverlässige Systeme und Netzwerke (DSN):[14] Flaggschiff -Konferenz der Gemeinschaft, jährlich seit 1970 abgehalten.
- Internationales Symposium für zuverlässige verteilte Systeme (SRDs):[15] Das 40. Angebot ist 2021.
Regionaler fokussierter Konferenzen:
- Lateinamerikanisches Symposium für zuverlässiges Computing (LADC): Das 10. Angebot ist 2021.
- Pacific Rim International Symposium über zuverlässiges Computing (PRDC): Das 25. Angebot ist 2021.
Zeitschriften
- IEEE -Transaktionen zu zuverlässigem und sicherem Computing (TDSC) ist das Flaggschiff -Journal, das unter den Zuständigkeitsbereich des IEEE Technical Committee on Fault Tolerant Computing (TCFTC) stellt.
- Prognostikjournal ist ein Open Access -Journal, das ein internationales Forum für die elektronische Veröffentlichung von Artikeln für originelle Forschung und industrielle Erfahrung in allen Bereichen der Systemverträger und Prognose bietet.
- Internationales Journal of Critical Computer-Based Systems
Bücher
- J. C. Laprie, Zuverlässigkeit: Grundkonzepte und Terminologie, Springer-Verlag, 1992. ISBN0-387-82296-8
- Daniel P. Siewiorek, Robert S. Swarz, Zuverlässige Computersysteme: Design und Bewertung, A K Peters/CRC Press, 1998. ISBN 978-1568810928
Forschungsprojekte
- Deserec, Zuverlässigkeit und Sicherheit durch verbesserte Rekonfigurierbarkeit, FP6/Ist integriertes Projekt 2006–2008
- Knoten[Permanent Dead Link], Netzwerk auf zuverlässigen Systemen
- ESFORs, Europäisches Sicherheitsforum für Webdienste, Software und Systeme, FP6/IST -Koordinationsaktion
- Versteck Hoch zuverlässige IP-basierte Netzwerke und Dienste, FP6/IST gezieltes Projekt 2006–2008
- WIDERSTEHEN FP6/Ist Network of Excellence 2006–2007
- Rodin Rigorose Open Development -Umgebung für komplexe Systeme FP6/IST gezieltes Projekt 2004–2007
- GELASSENHEIT Systemtechnik für Sicherheit und Zuverlässigkeit, FP6/IST Integrated Project 2006–2008
- Weidenüberlebensarchitektur, und STELZE, System für Terrorismusintervention und groß angelegte Teamarbeit 2002–2004
- Aniketos Zuverlässige und sichere Servicezusammensetzung, FP7/IST Integrated Project 2010–2014
Verweise
- ^ IEC, Elektropädie Del 192 Zuverlässigkeit, http://www.elecropedia.org, Select 192 Zuverlässigkeit, siehe Zuverlässigkeit 192-01-22.
- ^ a b A. Avizienis, J.-C. Laprie, Brian Randellund C. Landwehr ","Grundlegende Konzepte und Taxonomie zu verlässlichen und sicheren Computing, "IEEE-Transaktionen über zuverlässiges und sicheres Computing, Bd. 1, S. 11-33, 2004.
- ^ "Zuverlässige Systeme und Netzwerke". www.Dependability.org. Abgerufen 2021-06-08.
- ^ Brian Randell, "Software-Zuverlässigkeit: Eine persönliche Sichtweise", im Proc des 25. Internationalen Symposiums für Fehlertolerant Computing (FTCS-25), Kalifornien, USA, S. 35-41, Juni 1995.
- ^ J.C. Laprie. "Zuverlässige Computer- und Fehlertoleranz: Konzepte und Terminologie" in Proc. 15. IEEE INT. Symp. auf fehlertolerantes Computing, 1985
- ^ A. Avizienis, J.-C. Laprie und Brian Randell: Grundlegende Konzepte der Zuverlässigkeit. Forschungsbericht Nr. 1145, Lydford G Draas-CNRS, April 2001
- ^ I. Sommerville, Software Engineering: Addison-Wesley, 2004.
- ^ A. Avizienis, V. Magnus U, J. C. Laprie und Brian Randell, "Grundlegende Konzepte der Zuverlässigkeit", präsentiert bei ISW-2000, Cambridge, MA, 2000.
- ^ Moradi, Mehrdad; Van Acker, Bert; Vanherpen, Ken; Denil, Joachim (2019). Chamberlain, Roger; Taha, Walid; Törngren, Martin (Hrsg.). "Modell-implementierte Hybridfehlerinjektion für Simulink (Tool-Demonstrationen)". Cyber -physikalische Systeme. Modellbasiertes Design. Vorlesungsnotizen in Informatik. Cham: Springer International Publishing. 11615: 71–90. doi:10.1007/978-3-030-23703-5_4. ISBN 978-3-030-23703-5.
- ^ "Optimierung der Fehlerinjektion in der FMI-Co-Simulation durch Sensitivitätspartitionierung | Verfahren der Sommersimulationskonferenz 2019". dl.acm.org. Abgerufen 2020-06-15.
- ^ Moradi, Mehrdad, Bentley James Oakes, Mustafa Saraoglu, Andrey Morozov, Klaus Janschek und Joachim Denil. "Erforschen des Fehlerparameters unter Verwendung von Verstärkungslern-basierter Fehlerinjektion." (2020).
- ^ John C. Knight, Elisabeth A. Strunk, Kevin J. Sullivan: Auf dem Weg zu einer strengen Definition der Überlebensfähigkeit des Informationssystems Archiviert 2006-10-29 bei der Wayback -Maschine
- ^ John F. Meyer, William H. Sanders Spezifikation und Konstruktion von Leistungsfähigkeitsmodellen
- ^ "DSN 2022". dsn2022.github.io. Abgerufen 2021-08-01.
- ^ "SRDS-2021". srds-conference.org. Abgerufen 2021-08-01.