IuK 2003 Ansätze zur TeX-to-MathML Konvertierung - Semantik durch fachspezifische Usepackages Prof. Dr. Günter Törner Sebastian Pokutta Universität Duisburg-Essen - Standort Duisburg -
IuK 2003 Übersicht XML als Archivierungssprache Die TeX - Welt TeX MathML TeX-to-MathML
IuK 2003 XML als Archivierungssprache Archivierung : Lebendigerhaltung von Informationen Erfassung der entscheidenden Informationsebenen Archivierungsstrategie abhängig von den Quelldaten Beispiel: Kunst: maximale Erhaltung der Authentizität usw. Mathematik: Erhaltung der Semantik, äußere Form eher zweitrangig usw.
IuK 2003 XML als Archivierungssprache Vielfältigkeit von XML leichte Entwicklung von Dialekten Speicherung der Daten in formatiertem Text (Plain Text) Speicherung in mehreren Schichten möglich: Integration von Metainformationen wie Quelle, Beschreibung und ähnliches in das XML-Dokument. MathML 2 Informationsebenen: Speicherung von Presentation- und Content-Markup
IuK 2003 Die TeX - Welt Große Akzeptanz in den Naturwissenschaften erstellt optimale Druckvorlagen entwickelt als professionelles Textsatzsystem nicht proprietär semantische Informationen nur marginal vorhanden: table of contents, table of figures, keywords... Semantik wird vom Leser aus dem Kontext generiert. Beispiel: Was ist f ? Ableitung? zweites f? Potenz? TeX als Archivierungsformat? Aus: Notices of the AMS, Vol 49., No. 11 Michael Downes TeX and LaTeX 2e
IuK 2003 TeX MathML Konvertierung von TeX nach MathMLs Presentation-Markup relativ brauchbar Verlust von Content - Informationen ( z.B. Gliederung ) bei ausschließlicher Konvertierung ins Presentation-Markup Derzeitige Probleme: Viewer? Editoren? Kompatibilität? Generierung von Druckvorlagen durch einen MathML-to-? - Konverter MathML als direktes Eingabeformat nicht brauchbar
IuK 2003 TeX MathML \begin{eqnarray*} 1_{A}(x) := \begin{cases} 1, \text{ if } x \in A \\ 0, \text{ else } \end{cases} \end{eqnarray*} LaTeX ( original ):MathML (Hans Hagen, Pragma ade): Eine einfache Indikatorfunktion:
IuK 2003 Wie arbeitet TeX? Quelltext Präsentationsformat TeX Compiler
IuK 2003 Die Idee Quelltext Präsentationsformat TeX Compiler Usepackage Content Information Content Parser
IuK 2003 Die Vorteile Konvertierung in MathML auf beiden Ebenen eingeschränkt möglich Möglichkeit der Erzeugung von semantisch-äquivalenten Dokumenten Zusätzliche Informationen für die Konvertierung in das Presentation-Markup Übersetzung in darstellungs-äquivalente Dokumente und damit Unabhängigkeit von Schreibweisen
IuK 2003 Die Implementierung \newcommand{\scalarv}[2] {\ensuremath{#1 \cdot #2}} DarstellungSemantik #1 \cdot #2 \scalarv{#1}{#2}... Skalarprodukt
IuK 2003 Ein Beispiel Befehl im Usepackage Dargestellt wirdBedeutung \scalarv{a}{b}a \cdot bSkalarprodukt von a und b \scalars{v}{s}s \cdot vSkalarmultiplikation von Vektor v mit Skalar s \mul{x}{y}x \cdot yMultiplikation zweier Zahlen x und y
IuK 2003 Die nächsten Schritte... Entwicklung eines Usepackages fachspezifische Aufteilung der Mathematik (MSC) Konkordanzen zwischen den Fachgebieten Entwicklung eines Semantik-Parsers Diskussion über ein Ausgabeformat Marketing des Verfahrens Schulung der potentiellen Nutzer
IuK 2003 Kontakt Sebastian Pokutta Universität Duisburg-Essen - Standort Duisburg -