Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

Unkonventionelle Fehler

Ähnliche Präsentationen


Präsentation zum Thema: "Unkonventionelle Fehler"—  Präsentation transkript:

1 Unkonventionelle Fehler
In Hardware und Software

2 Bedeutung Unkonventionell: „nicht so, wie es allgemein üblich ist“[1]
Gegensatz: Konventionelle Fehler Keine vollständige Beispielsammlung

3 Murphy der Optimist “If anything can go wrong, it will go wrong.” “… and, if anything can’t go wrong, it will go wrong anyway.” “accidents are almost always the result of incorrect estimates of the likelihood of one or more things.” Quelle [2]

4 Problem Erfahrungswerte: Falsche Annahmen (tritt sowieso nie auf)
Anforderung >> Entwicklungszeit 5000 Stunden << 1 Fehler in Stunden Entwicklung ≠ Reparatur, Wartung Kein Einblick in laufenden Prozess, Reparatur, Austausch Man bekommt keine defekten Einheiten zu sehen Arroganz Es gibt keine Fehler, die ich nicht kenne Transiente Fehler, nicht reproduzierbar

5 Problem Abstraktion Spezialisierung
Aufteilen des Problems in mehrere Schichten mit mehr/weniger Details Fehler können in Schichten auftreten, die der Designer nicht sieht Spezialisierung Aufteilung des Problems in Teile von unterschiedlichen technologischen Disziplinen Fehler können sich in den „cracks“ der Disziplinen verstecken

6 Vorbild Chemieindustrie
U.S. Chemical Safety Board untersucht Unfälle und veröffentlicht Fehlerberichte zur zukünftigen Fehlervermeidung Nicht üblich in der Elektronik Industrie Websites in Flugzeugindustrie[3][4][5] Softwarefehler auf Wikipedia „List of Software Bugs“[6]

7 Vermeidung Veröffentlichungen lesen Aus (eigenen) Fehlern lernen
Selten zugänglich Zeitmanagement Aus (eigenen) Fehlern lernen Bug Reports immer ernst nehmen Abwegig denken möglichst keine Annahmen treffen Immer skeptisch sein

8 Byzantinische Fehler Ursprung aus der Theorie

9 Transmogrification STS-124 Fuel loading Complete system disagreement
Quelle [7]

10 Transmogrification „The act of changing into a different form or apperance often as if by magic“ Quelle [7]

11 Irrglaube der „Digitalen Schaltung“
Quelle [8]

12 Irrglaube der „Digitalen Schaltung“
Quelle [7]

13 Schrödingers CRC Quelle [8]

14 Mid-Value Select Quelle [7]

15 Terminierungswiderstand
Quelle [7]

16 Fehlerpropagation Hardware zu Software Software zu Hardware
Software geht immer von korrekt arbeitender Hardware aus Software zu Hardware Software kann Hardware gewollt (Angriff) oder ungewollt schädigen (Auslastung, Malware, …)

17 Swiss Cheese Model Videoquelle [9]

18 Swiss Cheese Model Aus dem Gesundheitswesen
Käsescheiben: Sicherheits- bzw. Abstraktionsebenen Löcher: Lücken in Maßnahmen und Fehler im Design Löcher wandern und ändern Größe Fault -> durch alle Löcher -> Failure

19 Ursachenbekämpfung Kapselung Built-in self-test nicht ausreichend
Komplexitätsverteilung Interfaces! Excessive Testing Schwer möglich Built-in self-test nicht ausreichend Coverage

20 Dokumentation Sehr wichtig Errata Schreiben Lesen
Sehr wichtig, da Vermeidung falscher Annahmen Errata Bekannte Fehler des Chipentwicklers Workarounds

21 Errata Designfehler Herstellungsfehler Intel FDIV Fehler
Hersteller kann auf Komponentenprobleme hinweisen Workaround Intel FDIV Fehler

22 Microcode Aufteilung von Assembler-Befehlen in CPU Subbefehle
Zu Ausführungszeit noch änderbar Gezielte Beeinflussung der Löcher im Swiss Cheese Modell Kann über BIOS oder Betriebssystem beeinflusst werden Änderung des Microcodes ohne Assembler Code zu verändern Bsp. Linux AMD Microcode

23 Race Conditions Multithreading/Multiprocessing Interrupts
Treten meist beim Testen nicht auf, schwer auffindbar

24 Beispiel Drei redundante Systeme, kugelgesichert Aluminium Box
Horizontale Motherboards Vertikale Leiterplatten Was könnte passieren? Quelle [7]

25 Beispiel Drei redundante Systeme, kugelgesichert Aluminium Box
Horizontale Motherboards Vertikale Leiterplatten Ein Kondensator in der untersten Box explodiert Quelle [7]

26 Beispiel Drei redundante Systeme, kugelgesichert Aluminium Box
Horizontale Motherboards Vertikale Leiterplatten Ein Kondensator in der untersten Box explodiert Splitter schießen nach oben und zerstören die anderen beiden Systeme Quelle [7]

27 Multi-chip Modul Quelle [7]

28 „verfluchtes“ Flugmanöver
Ansteigende Rechtskurve Stärker als 3G Etwas Seitenlage Höher als 3000 m Keine Anzeichen warum der Fehler auftrat Lösung: nur unter diesen Bedingungen nähert sich ein loses Kabel an Spannungsversorgung und sorgt für einen Spannungsüberschlag (18 kV) Quelle [7]

29 Verteiltes Prozessorsystem
Spannungskonverter versagt -> Überspannung Datenbus wird durch Überspannung in Dauerbetrieb versetzt Das System war so designt, dass für jeden Datenbus ein eigener Treiber pro Prozessor vorhanden war und Treiberausfälle unabhängig voneinander sind (Annahme!) Alle Treiber waren gleichzeitig betroffen Alle Datenbusse wurden gestaut System war als Flug Kontroll System geplant mit 10^-9 Fehlerwahrscheinlichkeit Quelle [7]

30 „Stuck At“ Fehler Quelle [7]

31 „Stuck At“ Fehler Quelle [7]

32 Input -> Output Quelle [7]

33 Frequency Divider Quelle [7]

34 „verflüchtigende“ Software
Quelle [7]

35 Errata lesen DMA Sequenz a, b, c, d, e, f, g, … Quelle [7]

36 „Komplett“ getestete Software
A und C sind exzessiv getestet B nicht Das System hatte keine Timing Probleme B funktionierte nicht mehr richtig nach kleiner Änderung von A Welche Routine funktionierte nicht mehr richtig? Routine C Quelle [7]

37 Conclusio Immer misstrauisch sein Je mehr Annahmen desto verwundbarer
Erfahrung Welche unkonventionellen Fehler kennen Sie?

38 Quellverzeichnis [1] Google Suche nach „unkonventionell Bedeutung“, https://www.google.at/?gws_rd=ssl#safe=off&q=unkonventionell [2] Murphy Was an Optimist, Präsentation von Kevin R. Driscoll, [3] Federal Aviation Administration „Lessons Learned Fom Transport Airplane Accidents“, [4] John Rushby‘s Anomalies in Digital Flight Control Systems [5] Safety-critical list archives, [6] Wikipedia, https://en.wikipedia.org/wiki/List_of_software_bugs

39 Quellverzeichnis 2 [7] List of Scenarios Honeywell, https://c3.nasa.gov/dashlink/static/media/other/ObservedFailures5.htm l, [8] Kevin Driscoll, Brendan Hall, Håkan Sivencrona, Phil Zumsteg; Byzantine Fault Tolerance, from Theory to Reality [9] Prof James Reason's Swiss Cheese Model, https://www.youtube.com/watch?v=twsA3z3xFVE,


Herunterladen ppt "Unkonventionelle Fehler"

Ähnliche Präsentationen


Google-Anzeigen