Management grosser Daten-Netze Dipl.-Ing. Christoph M. Lechner
Bitte Mobiltelephone ruhigstellen
Ablauf Juni 2004 –Vortrag, Diskussion und Fallbeispiele –Kaffeepausen, Mittagsunterbrechung –Ende spätestens 16:00 Juni 2004 –Präsentation der Gruppenarbeiten
Ziel der Veranstaltung Einführung in das Netzwerk-Management –Problemstellung –Anwendungsgebiete –Verfahren –Tools –Technische Details nach Bedarf Strategische Überlegungen zur Skalierbarkeit von Managementtools und -prozessen
Benotung Bis 30. Juli 2004 ca. zwei Seiten technisch detaillierter Aufsatz zu einem Netzwerk- management Thema (noch nicht gezeigtes Tool etc.) per .
Begriffsdefinition Netzwerk-Management Gesamtheit von –Verfahrensweisen –Techniken –Hilfsmitteln zur Verwaltung von Daten-Netzwerken
Managementbereiche
Layer 0: Kabelmanagement & Tools Layer 1: Verkabelungsmanagement & Tools Layer 2: Gerätemanagement & Tools cdp, mac-tabellen etc. Layer 3: IP-basiertes Netzwerkmanagement & Tools SNMP, Rmon etc. Dokumentation für den Störfall
Configuration Management Inventur –Hardware –Software Verbindungen Kabelwege Konfigurationen Änderungsmanagement (Change Control)
Configuration Management Hardware –Genauer Ort (Raum, Stockwerk, Schrank, HE usw.) –Seriennummern –Datum der Anschaffung/Inbetriebnahme –Garantie/Wartungsfristen –Service-Level, Service-Partner –Konfigurationsbeschreibung (Modul x in Slot y von Gerät z)
Configuration Management Software –Seriennummern, Lizenschlüssel –Datum der Anschaffung/Inbetriebnahme –Garantie/Wartungsfristen (updateservice) –Service-Level, Service-Partner (bugfix) –Parametrisierung (Adressen, alles, das zur Rekonstruktion benötigt wird)
Configuration Management Verbindungen –Genaue Bezeichnung des Anschlusses –Welches Interface wird damit mit welchem Gerät verbunden? –Link-Geschwindigkeit, Duplex etc. –Service-Level (hochkritisch oder unkritisch etc.) –Ausführende Person, Datum der Anschaltung –Kostenstelle zur Verrechnung
Configuration Management Kabelwege –Genauer Ort der Netzwerkanschlüsse –Genauer Ort der Patchfelder –Verlauf des Kabels (z.B. Microstation-Plan) –Meßprotokolle, Abnahmedokumentation –Kabellängen –Verwendete Stecker –Patchungen
Configuration Management Konfigurationen –Parametrisierung Adressen, alles, das zur Rekonstruktion benötigt wird –Benutzernamen/Passwörter –SNMP Communities –Trap-destinations –Syslogserver
Configuration Management Change Management –Wichtigster Prozess in der IT! –Wer ist wann wie und wie lange betroffen –Notfallplan, wenn etwas schief geht –Verständigungsliste –Beteiligtenliste –Durchführungsplan –Checkpoints –Kriterien zur Feststellung des Erfolges
Fault Management Meldungen (Events) Alarmmeldungen (Alarms) Problem Identifikation Problem-Behebung (Troubleshooting) Problem-Lösung (Solving) Fehlerdokumentation (Fault Logging)
Fault Management Meldungen (Events) –Nachrichten über ein Ereignis, das keine unmittelbar Sytemgefahr darstellt Port up/down Tür auf/zu Speicherplatz zu 85% gefüllt... –Protkollierung und Analyse notwendig Kann die Vorzeichen eines crashes ankündigen
Fault Management Alarm-Meldungen (Alarms) –Nachrichten über ein Ereignis, das eine unmittelbar Sytemgefahr darstellt Power failure Uplink down Speicherplatz zu 100% gefüllt... –Protkollierung und Analyse notwendig –Meist unmittelbarer Handlungsbedarf –Benachrichtigung der Bereitschaft
Fault Management Benachrichtigung der Bereitschaft –Klassifizierung des Ereignisses und Verständigung der zuständigen Personen –Rückmeldung, ob die Verständigung angekommen ist –Eskalationsverfahren bei Problempersistenz –Benachrichtigungswege eher outbound, d.h. unabhängig vom überwachten System. SMS Voic ?
Fault Management Problem-Identifikation –Oft komplexe Wirkzusammenhänge –Wenig Automatisationsunterstützung –Gute Dokumentation notwendig Wieder outbound, z.B. CD, Papier Graphische Darstellung des Netzwerkes –Information über letzte Änderungen –Hohes Maß an Erfahrung notwendig
Fault Management Problem-Behebung –(vorübergehende) Maßnahme zur Beseitigung der Problemauswirkung. –Workaround, Q&D etc. z.B. Flugkabel, andere Software... –Ziel ist, ein zumindest teilweise funktionsfähiges System bis zum nächsten Wartungsfenster zu haben. –Unbedingt dokumentieren –Aus dem Provisorium darf kein Dauerzustand werden!
Fault Management Problem-Lösung –Maßnahme zur nachhaltigen Beseitigung des Problems –Beseitigung der Ursachen –Maßnahmen, um eine Wiederholung zu verhindern –Dokumentation in Wissensdatenbank Evtl. Nachschulungen –Überprüfung, ob ähnliche Szenarien drohen
Fault Management Fehlerdokumentation (fault logging) –Jeder Fehler (auch wenn er durch die Technik automatisch korrigiert wurde) muß dokumentiert und analysiert werden –Trendanalyse z.B. Unsere 3 Jahre alten GBIC gehen vermehrt kaputt –Fehlerprevention Ältere GIBC vorsorglich tauschen
Performance Management Verfügbarkeit (Availability) Antwortzeiten (Response time) Durchsatz (Throughput) Nutzung (Utilisation) Kapazitätsplanung (Capacity)
Performance Management Verfügbarkeit (Availability) –% der Zeit, die das System während der vereinbarten Betriebszeiten zu den vereinbarten Bedingungen arbeitete –Basis der Dienstgütevereinbarung (Service Level) –Messung muß mit dem Kunden vereinbart werden Welche Parameter werden wo gemessen Gemeinsame Übereinkunft über die Problemursachen (z.B. DAU)
Performance Management Antwortzeiten (Response time) –Zeit, die eine Anwendung vom Userinput bis zur Reaktion benötigt –Meist nicht durch das Netz verursacht Delay kann sich aufsummieren –Basis der Dienstgütevereinbarung (Service Level) –Messung muß mit dem Kunden vereinbart werden Welche Parameter werden wo gemessen Gemeinsame Übereinkunft über die Problemursachen (z.B. DAU)
Performance Management Durchsatz (Throughput) –(Korrekt) übertragene Datenmenge pro Zeiteinheit Goodput Datenverlust (z.B. Hardwaredefekt) verursacht massive Verzögerungen –Basis der Dienstgütevereinbarung (Service Level) –Messung muß mit dem Kunden vereinbart werden Welche Parameter werden wo gemessen –Eigene probes an typischen Stellen installieren
Performance Management Nutzung (Utilisation) –Basis der Kapazitätsplanung –Typische Szenarien –Basis für Traffic Engineering Maßnamen –Absolut und in % der maximal verfügbaren Bandbreite
Performance Management Kapazitätsplanung (Capacity) –Trend Analyse –Ursachenforschung der Entwicklung –Vorhersage der weiteren Entwicklung –Maßnahmen zur Anpassung der Kapazitäten z.B. traffic-engineering Hardware upgrade
Accounting Management Investitions-Sicherung Kostenüberwachung Nutzungsverrechnung Kostenverrechnung
Security Management Allemeine Richtlinien (Policy) Befugnisse (Authority) Zugriffs-Ebenen (Access Level) Protkollierung (Logging) Regelverstösse (Exceptions) –Anmeldefehler (Authentication failure) –Intrusion detection
Strategische Überlegungen Skalierbarkeit von Managementtools und - prozessen –Verteilung/Speicherung der Dokumentation –Verständigungsverfahren –Out-tasking –Bereitschaftsregelungen
SNMP Simple Network Management Protocol UDP (!) Aktuell SNMPv3 (Draft RFC ), noch nicht verbreitet –Authentisierung (MD5) –Verschlüsselung (DES) –Klassenbildung OSI CMIP
SNMP Agent (im Device) Manager (zentrales tool) MIB Management Information Base – Öffentlicher und privater Teil – Baumstruktur Numerisch / Mnemonics Traps
SNMP RFCs =>> RTFM RFC A Simple Network Management Protocol RFC SNMP over Ethernet RFC IAB Official Protocol Standards RFC Tools for Monitoring and Debugging TCP/IP Internets and Interconnected Devices [superceded by RFC 1470] RFC Structure and Identification of Management Information for TCP/IP based internets. RFC 1156 (H)- Management Information Base Network Management of TCP/IP based internets RFC A Simple Network Managment Protocol RFC Management Information Base Network Management of TCP/IP based internets: MIB-II RFC 1161 (H)- SNMP over OSI RFC Bulk Table Retrieval with the SNMP RFC Concise MIB Definitions RFC Management Information Base for Network Management of TCP/IP-based internets: MIB-II RFC 1215 (I)- A Convention for Defining Traps for use with the SNMP RFC Techniques for Managing Asynchronously-Generated Alerts RFC 1270 (I)- SNMP Communication Services RFC 1303 (I)- A Convention for Describing SNMP-based Agents RFC 1470 (I)- A Network Management Tool Catalog RFC SNMP over IPX (obsolete, see RFC 1420) RFC SNMP over OSI RFC SNMP over AppleTalk RFC SNMP over IPX (replaces RFC 1298)
RMON Remote Monitor (RFC 1271, 1573) Neun Gruppen –Statistik –History –Host –Host top n –Matrix –Alarms –Events –Filter –Capture
Tools What´s up gold Orion Network Performance Monitor Logalot Denika NetHealth C6000 Cisco Works Epi-Center ForeView
Tools Tivoli –Netview MRTG Loriot SNAG-View 1.2 Remedy
C6000
Cisco-Works
links Hardware – – – Kabel – – –
links tools – – – traffic-shaper – – –
Management grosser Daten-Netze Dipl.-Ing. Christoph M. Lechner