8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer 07.02.2006 Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 1 Problembereiche bei der.

Slides:



Advertisements
Ähnliche Präsentationen
PC-Senioren Ludwigsburg
Advertisements

Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
für das Schulnetz der BS Roth
Inhalt – Technische Grundlagen
Aufbau des Internets Überblick Prof. Dr. T. Hildebrandt
Seminar Internet-Dienste
Ab ins Internet... unendliche Weiten
HTML - Einführung Richard Göbel.
Colibi Bibliothekssystem der Computerlinguistik. Einführung Motivation Was braucht Colibi? Software Datenbankdesign.
Windows Explorer.
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
Hassan Bidani Jallal Alami Rahmouni FH Wiesbaden
Java Server Pages Implementierung eines Web-Service-Clients Pea 13: Maik Opitz, Martin Melle, Philipp Hake.
Erstellen einer Webseite Fortbildung am FPGZ Stephan Best.
Eine Homepage für die Fachberatung Thomas Scholz.
Zukunft des Webs? Dennis Beer Christian Blinde
Briefkopfbogen anpassen
Seite Common Gateway Interface. Konzepte. Übersicht 1Einleitung 2Was ist CGI? 3Wozu wird CGI verwendet? 4Geschichtlicher Überblick 5Grundvoraussetzungen.
Interaktion mit Externen Diensten Carsten Schmidt/Andreas Schlesinger.
FH-Hof HTML - Einführung Richard Göbel. FH-Hof Komponenten des World Wide Webs WWW Browser HyperText Transfer Protocol (HTTP) via Internet WWW Server.
Informationen finden und beurteilen
Visualisierung von Folksonomies Seminar: Wissensorganisation 2.0? Julia Rehder.
Welche Funktion hat die php.ini? -Beinhaltet wichtige Einstellungen für PHP. Genannt seien hier u.a. der Speicherort von Cookies, Parameter der Kompilierung,
Datei- übertragungs- Programm
6 Mit dem Internet Explorer im WWW arbeiten
Learning By Doing Thema 1: Dynamische Webseiten und Online Datenbanken (Jarka Arnold) Thema 2: Simulationen, Sound, Schnittstellen (Aegidius Plüss) Thema.
Webseitengestaltung.
Applets Java für’s Web.
Gegenstand EDV Thema: Informative Webseiten
Client-Server Modell Advanced IT Basics Nicolas Frings.
VCRP- Designerkonferenz Workshop: Effektive Organisation von Lerninhalten mit Blackboard CE6 * Lernmodul * DISC/eTeaching Service Center – Dr. Dorit Günther,
Vor- und Nachteile von Flash Ein Kurzüberblick
Internet: Funktionsweise und Dienste
JavaScript.
Warum brauche ich ein CMS – Content Management System?
Haus der Geschichte Workshop CMS Typo3 Bonn,
1 Service H.-Georg Harries AGCO GmbH Inhalt Seite 2Allgemeines Seite 3 bis 12Programm Installationshinweise Seite 13 bis 22Programmierungshinweise.
Präsentation von Sonja Pathe
Basiswissen für Partner und interessierte Kunden Technologie.
Grundlagen: Client-Server-Modell
HTML-Editoren Eine Präsentation von Erik Kulisch.
Your name Bedeutung von Internet- Technologien Gruppe 1 Andreas Feuerstein Philipp Hochratner Christian Weinzinger.
Clientseitig Session IDs Erweiterungen wie NoScript Cookies verbieten Serverseitig Tokens HTML Entities verwenden 1.
IFB Speyer Daniel Jonietz dj 2 XAMPP - Was ist das? Paket mit: – X – Apache (Webserver) – MySQL oder SQLite (Datenbank) – Perl (Skriptsprache) –
ANDREAS LOHR, OLONDA S.R.O. Einfach anfangen mit HTML.
Browser sucht in diesem Ordner nach einer Seite namens
Agenda Rückblick 2. Aufbau der Software Benutzeroberfläche 4. Ausblick
Whitepaper - Feb © mailways GmbH Menschen wollen von Menschen beraten werden. Mit Hilfe des Internet lassen sich kostenschonende Wege für jede Phase.
2 Internet- Technologie Seite 1 Prof. J. WALTER Kurstitel Stand: september 2002 Internet-Technologie Herzlich Willkommen Prof. J. Walter.
Jonas Rüttimann 2. Juni Motivation Was ist RAP? Schnellstart: Wir bringen RAP zum Laufen! Technologie: Wie funktioniert RAP? Konsequenzen für die.
Aufzeichnung von Usability-Daten im www. Client-Side Log : automatisch (maschinell) generiertes Protokoll Client : Rechner mit dem Browser des Users Server:
Drucken mit XSL-FO DaimlerChrysler  Drucken von Webseiten
Client-Server-Modell
HTML, CSS und JavaScript
W W W - World Wide Web. Das World Wide Web kommt aus dem Englischen und bedeutet ‚Weltweites Netz‘ ist ein über das Internet abrufbares Hypertext-System.
© Fink/Spengler/AINF-Lehrgang 2003 – Folie 1 AINF/3. Jahrgang Netzwerke Anwendungen (Clientseitig) Karl Brenner, Andreas Fink, Gerhard Jüngling, Albert.
Grundlagen der Internetadresse
Online GIS Online GIS – Der Nutzer Matthias Hofschen, ESRI Germany ESRI EUROPEAN USER CONFERENCE.
Willkommen zum Brückensemester
prof. dr. dieter steinmannfachhochschule trier © prof. dr. dieter steinmann Folie 1 vom Montag, 30. März 2015.
HEX-code für die Farbe weiß: #FFFFFF Änderung von Inhalt & Darstellung Inhalt & Darstellung HTML Javascript CSS.
WeLoad Tagung der eLSA-Bundeslandkoordinator/innen
Alles was man wissen muss! By Benjamin Zehetner. Der Aufbau Der Standart Aufbau ist: (Hier muss alles drinnen sein) (Hier befinden sich wichtige Informationen.
Installation, Konfiguration, Online stellen, Zugriff © by Lars Koschinski 2003.
Klassische Werbeformen
Webserver Apache & Xampp Referenten: Elena, Luziano und Sükran
WINLearn Technische Umsetzung. Basistechnologie Oberfläche in HTML JSP (JavaServerPages) zur Datenauswertung Datenhaltung: Datenbank oder Filesystem JDBC.
Farbe Ändern von Rosa/lila zu (Hell- und Dunkel-)Grau Farben AGB FAQ Einbauservice Pumpenanfrage Versand & Lieferzeit.
WILLKOMMEN ZUM SOMMERKURS Kursthema: Frontend-Entwicklung für Webapplikationen M.Sc. Anna Prenzel, Sebastian Otto.
Content Management Systeme. Menü Header ContentSitebar.
 Präsentation transkript:

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 1 Problembereiche bei der Spiegelung der Websites mit Offline Explorer Pro: 2. Teile der Website befinden sich auf einem zweiten Server (häufig css oder Bilddateien) 3. Mouseover-Grafiken müssen nachgeladen werden (JavaSkript-Navigation) 4. Session-Ids (schon vorhandene Dateien werden nicht als solche erkannt, da sie eine neue Session-ID haben) 5. Ursprüngliche xml-Dateien werden nicht als html-Dateien erkannt und geparst 6.Dynamisch aufgebaute Webseiten werden in statische html-Seiten umgewandelt (großes Datenaufkommen, Interaktionsmöglichkeiten sind zum Teil auf den gespiegelten Webseiten nicht mehr möglich) 1. Die Website liegt nicht auf dem gedachten Server (es befindet sich dort nur eine Weiterleitung)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 2 1. Die Website liegt nicht auf dem gedachten Server Beide URLs werden in das Spiegelungsprogramm eingegeben. Letztere mit der Einschränkung auf den Unterordner der. Die Homepage des SPD-Unterbezirks Dresden-Elbe-Röder liegt eigentlich auf Beispiel: Mögliche Lösung:

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 3 Beispiel zu Punkt 1

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 4 2. Teile der Website befinden sich auf einem zweiten Server Homepage des ehemaligen NRW- Landtagsabgeordneten Georg Scholz Css-Dateien und ein Teil der Bilder liegen auf der RuhrOstSPD. Beispiel: Das Spiegelungsprogramm darf Css- und Bilddateien auch von anderen Servern holen. Mögliche Lösung:

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 5 Beispiel zu Punkt 2 (ohne css und Bilder)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 6 Beispiel zu Punkt 2 (mit css und Bildern von anderem Server)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 7 3. Mouseover-Grafiken müssen nachgeladen werden Homepage des SPD-Ortsvereins Bad Sooden-Allendorf JavaScript-Navigation verwendet Buttons, die beim Mouseover ausgetauscht werden. Die Mouseover-Buttons fehlen nach der Spiegelung. Beispiel: Mit Hilfe des LogWindow im Spiegelungsprogramm lassen sich die Namen und Pfade fehlender Dateien ermitteln und nachträglich gezielt nachladen. Mögliche Lösung:

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 8 Beispiel zu Punkt 3 (ohne Mouseover-Bilder)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 9 Beispiel zu Punkt 3 (mit Mouseover-Bildern)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn Session-Ids Beispiel: Der Offline Explorer bietet die Möglichkeit, Teile der URL beim Spiegelungsprozess zu entfernen bzw. auszutauschen (URL Substitutes...). In diesem Falle wurde die Session-ID entfernt. Mögliche Lösung: Homepage des SPD-Ortsvereins Wulfen Schon vorhandene Dateien werden nicht als solche erkannt, da sie eine neue Session-ID haben. Der Spiegelungsprozess kommt nicht zum Ende und die Dateien sind, jeweils unter einem neuen Ordner abgelegt, mehrfach vorhanden.

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 11 Beispiel zu Punkt 4 (Session-Id in rot)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 12 Vergleich der Dateistruktur mit (links) und ohne (rechts) Session-ID

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn Ursprüngliche xml-Dateien werden nicht als html-Dateien erkannt und geparst Homepage des SPD- Landesverbandes Sachsen-Anhalt Mit Ausnahme der durch das Spiegelungsprogramm angelegten Startseite (default.htm), wird beim Aufruf der Dateien mit dem Browser eine Fehlermeldung ausgegeben, da den Dateien sowohl die Dateiendung.htm als auch ein Starttag fehlt. Beispiel: Der Offline Explorer bietet die Möglichkeit, ein komplettes Spiegelungsprojekt zu exportieren. Dabei werden die Dateien analysiert und automatisch ein Tag an den Anfang des Quelltextes gesetzt. Der Browser erkennt dann die Datei als html. Mögliche Lösung:

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 14 Beispiel zu Punkt 5 (Fehlermeldung bei den gespiegelten Seiten vor dem Export)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 15 Quelltext vor dem Export

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 16 Webseite nach dem Export

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 17 Quelltext nach dem Export

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 18 Homepage der hessischen Landtagsabgeordneten Heike Habermann Durch das Aneinanderreihen verschiedener Übergabeparameter im Dateinamen werden im Laufe der Spiegelung sehr viele Dateien angelegt, welche sich oft nur in Nuancen unterscheiden. Beispiel: Durch URL-Substitutes, Ausschluss bestimmter Dateinamen oder auch durch eine Verringerung der Linktiefe lässt sich der Umfang einer solchen Spiegelung verringern. Dennoch bleibt ein hohes Datenaufkommen (eventuell auch mit vielen Redundanzen) bei relativ geringem inhaltlichen Gewinn Mögliche Lösung: 6. Dynamisch aufgebaute Webseiten werden in statische html-Seiten umgewandelt (großes Datenaufkommen, Interaktionsmöglichkeiten sind zum Teil auf den gespiegelten Webseiten nicht mehr möglich)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 19 Interaktion ohne Client-Server-Dynamik: Server Client 1 Client 2 Client 3 Anfragen Vorproduzierte statische Inhalte (html-Seiten) Statische Standard-Webseiten Clientseitige Interaktivität (JavaScript, JavaApplets, skriptfähige Animationen wie Flash)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 20 Interaktion mit Client-Server-Dynamik Dynamische Webseiten Server Client 1 Client 2 Client 3 Anfragen Dynamische Webseiten (zum Teil datenbankgestützt), die beim Browser des Clients als html-Seiten ankommen 1. Serverseitiges Skripting (ASP, JSP, PHP) 2. Serverseitig installierte Zusatzprogramme (plugins, cgis)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn Die Edith-Stein-Schule werde Beispiel zu Punkt 6 (zwei Dateien einer dynamischen Webseite)

8. Workshop - Internetarchivierung 3.1. Erfassung/Bewertung/Transfer Sabine Widmaier, Friedrich-Ebert-Stiftung, Bonn 22 Die Suche in den Dateien der Spiegelung nach einem bestimmten Artikel ergab 50 Treffer: