Fehlerbehandlung (Recovery)

Slides:



Advertisements
Ähnliche Präsentationen
Kapitel 15 Verteilte Datenbanken
Advertisements

Mehrbenutzersynchronisation
Transaktionsverwaltung Beispiel einer typischen Transaktion in einer Bankanwendung: 1.Lese den Kontostand von A in die Variable a: read(A,a); 2.Reduziere.
Übersicht RAID-Verfahren Labor für Betriebsdatenverarbeitung
Transaktionsverwaltung
Transaktionsverwaltung
© A. Kemper / A. Eickler1 Fehlerbehandlung (Recovery) 1.Lokaler Fehler in einer noch nicht festgeschriebenen (committed) Transaktion Wirkung muss zurückgesetzt.
1 Fehlerbehandlung (Recovery) 1.Lokaler Fehler in einer noch nicht festgeschriebenen (committed) Transaktion Wirkung muss zurückgesetzt werden R1-Recovery.
Transaktionsverwaltung Beispiel einer typischen Transaktion in einer Bankanwendung: 1.Lese den Kontostand von A in die Variable a: read(A,a); 2.Reduziere.
1 Fehlerbehandlung (Recovery) 1.Lokaler Fehler in einer noch nicht festgeschriebenen (committed) Transaktion Wirkung muss zurückgesetzt werden R1-Recovery.
Vorlesung Informatik 2 Algorithmen und Datenstrukturen (27 – Kürzeste Wege) Prof. Th. Ottmann.
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 22: Grundlagen der Crash Recovery.
Transaktionen in verteilten Datenbanken
Prof. Dr. T. Kudraß1 Recovery. Prof. Dr. T. Kudraß2 Fehlerarten: Transaktionsfehler Transaktionsfehler –Freiwilliger Transaktionsfehler durch eine ROLLBACK-Anweisung.
Access 2000 Datenbanken.
Datenbanksysteme für FÜ WS 2004/2005 Transaktionen 1 Worzyk FH Anhalt Transaktionen und Parallelverarbeitung Eigenschaften von Transaktionen Konsistenz.
Datenbanksysteme für FÜ SS 2000 Seite Worzyk FH Anhalt Transaktionen und Parallelverarbeitung Eigenschaften von Transaktionen Konsistenz Isolation.
Kapitel 13: Mehrbenutzersynchronisation
Kapitel 14: Recovery Oliver Vornberger
1 Kapitel 12: Transaktionsverwaltung Oliver Vornberger Fachbereich Mathematik/Informatik Universität Osnabrück Osnabrück
1 Kapitel 12: Transaktionsverwaltung. 2 Transaktion Bündelung mehrerer Datenbankoperationen Mehrbenutzersynchronisation Recovery.
Universität Karlsruhe (TH) © 2008 Univ,Karlsruhe, IPD, Prof. LockemannDBI 7 Kapitel 7 Zugriffsschicht: Zuverlässigkeit.
Recovery AIFB SS Recovery 5.1 Fehler im Datenbankbetrieb(1/10) (1)Transaktionsfehler (TF) (2)Systemfehler (SF) (3)Speicherfehler (SpF) Fehlerfallen.
ausdrucksschwächeres
Transaktion 1Transaktion 2... Transaktion n Synchronisation durch Scheduler Datenbasis-Verwalter lokaler Schedule 1lokaler Schedule n konfliktserialisierbarer.
Recovery AIFB SS Einbringstrategie der Pufferverwaltung(1/4) Die bestimmt, wann geänderte Seiten in die Datenbank eingebracht werden. Sie.
Recovery AIFB SS (1/8) Sicherungspunkte (Checkpoints) (1/8) (1) Transaktions-Orientierte Sicherungspunkte Transaction-Oriented Checkpoint.
Ausführungsmodell Zustandsübergang einer Transaktion aus Nutzersicht:
Implementierung von S2PL (1) Scheduler als Verwalter von Sperren auf Datenelementen sowie Warteschlangen für Sperren (Sperren-Verwalter). Transaktion 1Transaktion.
Modellierung von Transaktionen Zur Formalisierung der ACID-Garantien muss Verhalten von Transaktionen modelliert werden. Folge aus der Forderung nach lokaler.
Synchronisation paralleler Transaktionen AIFB SS Konzept der Transaktion 4.2 Konzept der Transaktion (1/4) Eine Transaktion ist ein in sich geschlossener,
Betriebliche Informationssysteme Prof. Dr. Michael Löwe
Gottfried Vossen 5. Auflage 2008 Datenmodelle, Datenbanksprachen und Datenbankmanagementsysteme Kapitel 21: Concurrency Control.
Mehrbenutzersynchronisation
WS 2012/13 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #11 Transaktionsverwaltung.
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #6 Fehlerbehandlung.
WS 2011/12 Datenbanksysteme Mi 15:15 – 16:45 R Vorlesung #10 Transaktionsverwaltung.
WS 2004/2005 Datenbanken II - 5W Mi 17:00 – 18:30 G 3.18 Vorlesung #7 Mehrbenutzersynchronisation (Teil 1)
Vorlesung #9 Fehlerbehandlung
Vorlesung Datenbanksysteme vom Physische Datenorganisation
Festschreibe-Protokoll (1) Globales Zwei-Phasen-Festschreibe-Protokoll (2- Phasen-Commit, 2PC): Phase 1: –Koordinator benachrichtigt Ressourcen, dass Commit.
Transaktion Huang Zhenhao FU Shuai.
Vorlesung #12 Mehrbenutzersynchronisation
Datenbanksysteme Technische Grundlagen Transaktions-Konzept, Mehrbenutzer-Synchronisation, Fehlerbehandlung Prof. Dr. Manfred Gruber FH München.
Vorlesung Datenbanksysteme WS 2.0 Christoph Koch (Subject: DBVO:...
ADAT©2004,2006 Dipl. - Ing. Walter SabinSeite: 48 Version 1.0a Recovery Wiederherstellung eines konsistenten Datenbankzustandes nach Fehlersituationen.
Lokales 2-Phasen-Festschreibe- Protokoll Segment-Verwalter führt commit(T i ) in zwei Phasen aus: Phase 1: Sicherstellung der Wiederholbarkeit. –Für jedes.
Übung: Transaktionale Systeme
Transaktionen Dr. Heidrun Bethge Datenbanken II.
Mehrbenutzersynchronisation
Transaktionsverwaltung
Wiederanlauf nach Systemzusammenbruch Aufgabe: Bei Noforce-Strategie Wiederholung aller noch nicht in die Datenbasis eingebrachten Änderungen bereits abgeschlossener.
Recovery    AIFB SS Grundlegende Annamen(1/2) Um den Erfolg der der Recovery-Maßnahmen zu gewährleisten, werden folgende Annahmen.
Transaktionen in verteilten Datenbanken
Puffer-Verwalter (1) Aufgabe: Performanzkontrolle bzgl. Hauptspeichernutzung. Puffer-Verwalter versucht, Plattenzugriffe durch Vorhalten von häufig benötigten.
Sicherung gegen Medienverlust (1) Medienverlust = Verlust der Datenbasis und/oder des Protokolls. Vorbeugung durch periodische Sicherung von Datenbasis.
Recovery    AIFB SS (1/6) Durchführung der Recovery-Maßnahmen(1/6) Transaktions-Fehler (TF) T1 T2 T3 Zeitt Transaktion T2 wird vom.
unpin(a,b,c) flush(a,b,c)
Transaktionsverwaltung Beispiel einer typischen Transaktion in einer Bankanwendung: 1.Lese den Kontostand von A in die Variable a: read(A,a); 2.Reduziere.
Seminar zur Administration von Datenbankmanagementsystemen 8. 6
Prof. Dr. T. Kudraß1 Transaktionsmanagement - Einführung.
Datenbanktechnik 1 Datenbanktechnik II Kapitel 3.0 bis 4.0.
Transaktionsverwaltung Beispiel einer typischen Transaktion in einer Bankanwendung: 1.Lese den Kontostand von A in die Variable a: read(A,a); 2.Reduziere.
Übung – Recovery Manager Undo Redo Algorithmus
Vorlesung #7 Fehlerbehandlung
Transaktionsabbruch, System Crash, Media Failure
Vorlesung #7 Fehlerbehandlung
Vorlesung #7 Fehlerbehandlung
Vorlesung #10 Fehlerbehandlung
Redo/Undo Ersetzungsstrategie: LRU
 Präsentation transkript:

Fehlerbehandlung (Recovery) Fehlerklassifikation Lokaler Fehler in einer noch nicht festgeschriebenen (committed) Transaktion Wirkung muss zurückgesetzt werden R1-Recovery Fehler mit Hauptspeicherverlust Abgeschlossene TAs müssen erhalten bleiben (R2-Recovery) Noch nicht abgeschlossene TAs müssen zurückgesetzt werden (R3-Recovery) Fehler mit Hintergrundspeicherverlust R4-Recovery Recovery

Fehlertypen Fehler Fehlerart Fehler-Frequenz fail-over time R1 undo gescheiterter T. Sekunden ms R2 redo der Winner Hauptspeicherverlust Tage-Monate min R3 undo der Loser Hauptspeicherverlust R4 Katastrophen-Management Hintergrundspeicherverlust Jahre Stunden Recovery

Zweistufige Speicherhierarchie DBMS-Puffer Hauptspeicher Hintergrundspeicher Festplatte A‘ D Einlagerung PA PC A‘ D C‘ C . Auslagerung PB B Recovery

Die Speicherhierarchie Ersetzung von Puffer-Seiten ¬steal: Bei dieser Strategie wird die Ersetzung von Seiten, die von einer noch aktiven Transaktion modifiziert wurden, ausgeschlossen. steal: Jede nicht fixierte Seite ist prinzipiell ein Kandidat für die Ersetzung, falls neue Seiten eingelagert werden müssen. Einbringen von Änderungen abgeschlossener TAs Force-Strategie: Änderungen werden zum Transaktionsende auf den Hintergrundspeicher geschrieben. ¬force-Strategie: geänderte Seiten können im Puffer verbleiben. Recovery

Auswirkungen auf Recovery force ¬force ¬steal kein Undo kein Redo Redo steal Undo Recovery

Normalfall: steal und ¬force gleichzeitig Worst-Case DBMS-Puffer Hauptspeicher Hintergrundspeicher Festplatte Einlagerung PA committete Daten A dirty Data . Auslagerung PB aufgrund ¬force aufgrund steal Recovery

Einbringungsstrategien Update in Place jede Seite hat genau eine „Heimat“ auf dem Hintergrundspeicher der alte Zustand der Seite wird überschrieben Twin-Block-Verfahren Anordnung der Seiten PA , PB , und PC . Schattenspeicherkonzept nur geänderte Seiten werden dupliziert weniger Redundanz als beim Twin-Block-Verfahren Recovery

Hier zugrunde gelegte Sytemkonfiguration steal „dreckige Seiten“ können in der Datenbank (auf Platte) geschrieben werden ¬force geänderte Seiten sind möglicherweise noch nicht auf die Platte geschrieben update-in-place Es gibt von jeder Seite nur eine Kopie auf der Platte Kleine Sperrgranulate auf Satzebene also kann eine Seite gleichzeitig „dreckige“ Daten (einer noch nicht abgeschlossenen TA) und „committed updates“ enthalten das gilt sowohl für Puffer – als auch Datenbankseiten Recovery

Protokollierung von Änderungsoperationen Struktur der Log-Einträge [LSN, TransaktionsID, PageID, Redo, Undo, PrevLSN] LSN (Log Sequence Number), eine eindeutige Kennung des Log-Eintrags. LSNs müssen monoton aufsteigend vergeben werden, die chronologische Reihenfolge der Protokolleinträge kann dadurch ermittelt werden. Transaktionskennung TA der Transaktion, die die Änderung durchgeführt hat. PageID die Kennung der Seite, auf der die Änderungsoperationen vollzogen wurde. Wenn eine Änderung mehr als eine Seite betrifft, müssen entsprechend viele Log-Einträge generiert werden. Recovery

Protokollierung von Änderungsoperationen II Struktur der Log-Einträge II [LSN, TransaktionsID, PageID, Redo, Undo, PrevLSN] Die Redo -Information gibt an, wie die Änderung wiederhergestellt werden kann. Die Undo -Information beschreibt, wie die Änderung rückgängig gemacht werden kann. PrevLSN, einen Zeiger auf den vorhergehenden Log-Eintrag der jeweiligen Transaktion durch Verweis auf deren Log Sequence Number. Diesen Eintrag benötigt man aus Effizienzgründen. Recovery

Beispiel einer Log-Datei Schritt T1 T2 Log [LSN, TA, PageID, Redo, Undo, PrevLSN] 1. BOT [#1,T1,BOT,0] 2. r(A,a1) 3. [#2,T2,BOT,0] 4. r(C,c2) 5. a1 := a1 - 50 6. w(A,a1) [#3,T1,PA,A-=50,A+=50,#1] 7. c2 := c2 + 100 8. w(C,c2) [#4,T2,PC,C+=100,C-=100,#2] 9. r(B,b1) 10. b1 := b1 + 50 11. w(B,b1) [#5,T1,PB,B+=50,B-=50,#3] 12. commit [#6,T1,commit,#5] 13. r(A,a2) 14. a2 := a2 – 100 15. w(A,a2) [#7,T2,PA,A-=100,A+=100,#4] 16. [#8,T2,commit,#7] Recovery

Logische oder physische Protokollierung Es werden Inhalte / Zustände protokolliert: before-image enthält den Zustand vor Ausführung der Operation after-image enthält den Zustand nach Ausführung der Operation Logische Protokollierung das Before-Image wird durch Ausführung des Undo-Codes aus dem After-Image generiert und das After-Image durch Ausführung des Redo-Codes aus dem Before-Image berechnet. Speicherung der Seiten-LSN Die „Herausforderung“ besteht darin, beim Wiederanlauf zu entscheiden, ob man das Before- oder das After-Image auf dem Hintergrundspeicher vorgefunden hat. Dazu wird auf jeder Seite die LSN des jüngsten diese Seite betreffenden Log-Eintrags gespeichert. Recovery

Schreiben der Log-Information AP1 APn · · · DBMS- Code Log- Puffer  Datenbank- Puffer Log-Datei Log-Archiv Datenbasis DB-Archiv Recovery

Schreiben der Log-Information Die Log-Information wird zweimal geschrieben Log-Datei für schnellen Zugriff R1, R2 und R3-Recovery Log-Archiv R4-Recovery Recovery

Anordnung des Log-Ringpuffers Log-Datei #10 #30 #20 #41 #40 ... ausschreiben eintragen ... Log- Archiv Recovery

Das WAL-Prinzip Write Ahead Log-Prinzip Bevor eine Transaktion festgeschrieben (committed) wird, müssen alle „zu ihr gehörenden“ Log-Einträge ausgeschrieben werden. Bevor eine modifizierte Seite ausgelagert werden darf, müssen alle Log-Einträge, die zu dieser Seite gehören, in das temporäre und das Log-Archiv ausgeschrieben werden. Recovery

Wiederanlauf nach einem Fehler Transaktionsbeginn und – ende relativ zu einem Systemabsturz Zeitachse T2 T1 t1 t2 t3 Absturz Transaktionen der Art T1 müssen hinsichtlich ihrer Wirkung vollständig nachvollzogen werden. Transakionen dieser Art nennt man Winner. Transaktionen, die wie T2 zum Zeitpunkt des Absturzes noch aktiv waren, müssen rückgängig gemacht werden. Diese Transaktionen bezeichnen wir als Loser. Recovery

Drei Phasen des Wiederanlaufs Analyse: Die temporäre Log-Datei wird von Anfang bis zum Ende analysiert, Ermittlung der Winner-Menge von Transaktionen des Typs T1 Ermittlung der Loser-Menge von Transaktionen der Art T2. Wiederholung der Historie: alle protokollierten Änderungen werden in der Reihenfolge ihrer Ausführung in die Datenbasis eingebracht. Undo der Loser: Die Änderungsoperationen der Loser-Transaktionen werden in umgekehrter Reihenfolge ihrer ursprünglichen Ausführung rückgängig gemacht. Recovery

Wiederanlauf in drei Phasen Log Analyse 2. Redo aller Änderungen (Winner und Loser) 3. Undo aller Loser-Änderungen Fehlertoleranz (Idempotenz) des Wiederanlaufs undo(undo(...(undo(a))...)) = undo(a) redo(redo(...(redo(a))...)) = redo(a) auch während der Recoveryphase kann das System abstürzen Recovery

Beispiel einer Log-Datei Schritt T1 T2 Log [LSN, TA, PageID, Redo, Undo, PrevLSN] 1. BOT [#1,T1,BOT,0] 2. r(A,a1) 3. [#2,T2,BOT,0] 4. r(C,c2) 5. a1 := a1 - 50 6. w(A,a1) [#3,T1,PA,A-=50,A+=50,#1] 7. c2 := c2 + 100 8. w(C,c2) [#4,T2,PC,C+=100,C-=100,#2] 9. r(B,b1) 10. b1 := b1 + 50 11. w(B,b1) [#5,T1,PB,B+=50,B-=50,#3] 12. commit [#6,T1,commit,#5] 13. r(A,a2) 14. a2 := a2 – 100 15. w(A,a2) [#7,T2,PA,A-=100,A+=100,#4] 16. [#8,T2,commit,#7] Recovery

Kompensationseinträge im Log #1 #6 #5 #3 #4 #2 #7 T2 Wiederanlauf und Log #1 #6 #5 #3 #4 #2 #7 #7‘ #2‘ #4‘ UndoNxtLSN Kompensationseinträge (CLR: compensating log record) für rückgängig gemachte Änderungen. #7` ist CLR für #7 #4` ist CLR für #4 Recovery

Logeinträge nach abgeschlossenem Wiederanlauf [#1,T1,BOT,0] [#2,T2,BOT,0] [#3,T1,PA,A-=50,A+=50,#1] [#4,T2,PC,C+=100,C-=100,#2] [#5,T1,PB,B+=50,B-=50,#3] [#6,T1,commit,#5] [#7,T2,PA,A-=100,A+=100,#4] <#7‘,T2,PA,A+=100,#7,#4> <#4‘,T2,PC,C-=100,#7‘,#2> <#2‘,T2,-,-,#4‘,0> Recovery

Logeinträge nach abgeschlossenem Wiederanlauf II CLRs sind durch spitze Klammern <...> gekennzeichnet. der Aufbau eines CLR ist wie folgt LSN TA-Identifikator betroffene Seite Redo-Information PrevLSN UndoNxtLSN (Verweis auf die nächste rückgängig zu machende Änderung) CLRs enthalten keine Undo-Information warum nicht? Recovery

Lokales Zurücksetzen einer Transaktion Partielles Zurücksetzen einer Transaktion 3‘ 4‘ 5 4 3 2 1 . . . Historie Log . . . #2 #4 #4‘ #3‘ #5 #1 #3 Schritte 3 und 4 werden zurückgenommen notwendig für die Realisierung von Sicherungspunkten innerhalb einer TA Recovery

Sicherungspunkte Transaktionskonsistente Sicherungspunkte Absturz Sicherungspunkt Si angemeldet Sicherungspunkt Si geschrieben T1 T2 T3 T4 Zeitachse Sicherungspunkt Si-1 Recovery

Drei unterschiedliche Sicherungspunkt-Qualitäten Log Sicherungspunkt (a) transaktionskonsistent Analyse Redo Undo (b) aktionskonsistent Analyse Redo MinLSN Undo (c) unscharf (fuzzy) Analyse MinDirtyPageLSN Redo MinLSN Undo Recovery

Aktionskonsistente Sicherungspunkte Transaktionsausführung relativ zu einem aktions-konsistenten Sicherungspunkt und einem Systemabsturz Systemabsturz Sicherungspunkt T1 T2 T3 T4 T5 Zeitachse Recovery

Unscharfe (fuzzy) Sicherungspunkte modifizierte Seiten werden nicht ausgeschrieben nur deren Kennung wird ausgeschrieben Dirty Pages = Menge der modifizierten Seiten MinDirtyPageLSN: die minimale LSN, deren Änderungen noch nicht ausgeschrieben wurde MinLSN: die kleinste LSN der zum Sicherungszeitpunkt aktiven TAs Recovery

R4-Recovery / Media-Recovery Recovery nach einem Verlust der materialisierten Datenbasis materialisierte Datenbasis temporäre Log-Datei konsistente Datenbasis Fehler Datenbasis- Archiv Log- Archiv Recovery

Oracle: Commit Parameter COMMIT WRITE WAIT; Default. Commit wird durchgeführt, sobald der LogWriter die Nachricht zurückgibt, dass alle Einträge aus dem Log-Buffer bezüglich der betreffenden Transaktion erfolgreich in die Log-Dateien auf Platte geschrieben wurden. COMMIT WRITE NOWAIT; Für ein Commit wird nicht auf die Nachricht des LogWriters gewartet, dass die Log-Einträge in den Log-Dateien gelandet sind. COMMIT WRITE BATCH; Transaktionen werden in Gruppen zusammengefasst und gemeinsam in die Log-Dateien geschrieben und damit gemeinsam committed. COMMIT WRITE IMMEDIATE; Log-Buffer wird sofort in die Log-Dateien ausgeschrieben. Recovery