CJK-Katalogisierung in Originalschrift - Arbeitsstand und Planungen -

Slides:



Advertisements
Ähnliche Präsentationen
Zentrales Verzeichnis Digitalisierter Drucke
Advertisements

Externe Referenzen in ODS Am Beispiel von VSIM 27.Oktober
Datenbankanbindung mit ASP Wilhelm-Schickard-Schule Tübingen
ERP- und Team-Erweiterungen für Microsoft Project.
Verwendungszweck: Diese Folien dienen zur Unterstützung von Microsoft Dynamics NAV-Vertriebsmitarbeitern und -Partnern für Produktpräsentationen beim Kunden.
Systemverwaltung wie es Ihnen gefällt.
Galileo Die Visualisierungssoftware für XVH und XVC
Digitale Inhalte Silke Schomburg Anwendertreffen Digibib 2005.
Emulation Aleph lokal 14.2 Aleph Verbund 16.02
Aus der Geschichte der Schrift
Virtuelle Fachbibliothek Bibliothekswesen Fachinformationsführer.
SendEplanung Datenbank
AG Titeldaten(modellierung)
Praxis der Metadatenerfassung Markus Enders Goettingen State and University Library
Signalisierung von Benutzeranforderungen zur Anpassung von Videoströmen
Koha in Action Das Open-Source-Bibliothekssystem im Praxiseinsatz
Mobile Gebäudeservicesteuerung Optimierung des Datentransfers im
Schulz & Löw Consulting GmbH
Relationale Datenbankmodelle
Normdaten und Metadaten Die Idee eines Internationalen Authority File Christel Hengel Die Deutsche Bibliothek META-LIB-Workshop, 22. Oktober 2002, Die.
1. Metadaten-Workshop der AfS / META-LIB-Abschluss-Workskop, 21./22. Oktober 2002 Zusammenfassung, Ausblick Renate Gömpel Arbeitsstelle für Standardisierung.
Fernleihprozesse im SWB-Verbund Datenbezieherworkshop am in Frankfurt (Deutsche Nationalbibliothek) Cornelia Katz.
Clustered Neuronal Network A C#.NET project for Compute Cluster Server 2003.
Web-HMI einbinden SPS-Technik mit Video, Multimedia und Entertainmentsystemen kombinieren I Peter Steib.
Scantoweb hosted by hbz Anette Seiler 19. Februar 2009.
Saia® Systemkatalog Kapitel B2-Kommunikation & Interaktion
Character Set Standards Nicht kodierte Charset Standards Kodierte Charset Standards Internationale Charset Standards.
Masc CJD Jugenddorf Offenburg ProfilAC … powered by Polikles ® 25. bis 27. Januar 2005 masc ag, rotkreuz
Microsoft Office Project & Project Server 2003 Die neuen Möglichkeiten der bereichs- und projektübergreifenden Projekt- und Ressourcensteuerung.
Kalliope Offenes Verbundinformationssystem für Nachlässe und Autographen in Deutschland Regelwerk und Normdaten in der Anwendung Jutta Weber Wien Archivtagung.
Flexible Datenstrukturen
Betrieb von Datenbanken Marco Skulschus & Marcus Wiederstein Datenmanipulation Lehrbuch, Kapitel 4.
Österreichische Akademie der Wissenschaften Bibliothek
Wo finde ich Meta-Tags…? Was sind Metatags…? Welche Meta-Tags sind am beliebtesten…? Sprachen von Meta-Tags…? Was ist eine Profildatei…? VTAB-09 Fenster.
Extended Payment Terms Flexible Zahlungslösungen für Microsoft Enterprise Agreements.
© Bibliothek und Archiv der Österreichischen Akademie der Wissenschaften Katalogisierung in RAK / MAB2 Beispiele 1. Teil Lösungen Verbund für Bildung und.
© Bibliothek und Archiv der Österreichischen Akademie der Wissenschaften Katalogisierung in RAK / MAB2 Zusatzbeispiele Lösungen Verbund für Bildung und.
1 Nutzen Sie diese Powerpoint-Präsentation beim Selbstlernen oder in Veranstaltungen zur Einführung in das jeweilige Thema. Einführung Lernmodul Nutzungsbedingungen:
26. April Perspektiven einer Nachlass- und Autographenkatalogisierung im österreichischen Bibliothekenverbund Walter Zabel
8. Mai Perspektiven einer Nachlass- und Autographenkatalogisierung im österreichischen Bibliothekenverbund.
Was Benutzer wollen – mehr als Metadaten Anette Seiler 98. Deutscher Bibliothekartag, Erfurt, 5. Juni 2009.
Aktuelle Produktstände – TRIBASE
H. Isenberg Plattdeutsches Wörterbuch der Gemeinde Twistetal Die Waldecker Kauhlhasen Mai 2007.
Grundsätzliches, Status und Perspektiven
Einführung, Übergangsregeln, Format und Recherche
Schulungsunterlagen der AG RDA
Schulungsunterlagen der AG RDA
Untersuchungen zur Erstellung eines
Schulungsunterlagen der AG RDA
Romanisierung: Chinesische Schriftzeichen -> Pinyin
Romanisierung: Chinesische Schriftzeichen -> Pinyin Vortragende: Jue Wang, Wenchao Li.
Vertretungen der Öffentlichen Bibliotheken
CrossAsia: Projekt, Datenbanken, Göttinger Beitrag (OGEA)
Oracle Portal think fast. think simple. think smart. Dieter Lorenz, Christian Witt.
RDA, MARC und Co. | Österreichischer Bibliothekartag Sarah Hartmann RDA, MARC und Co. Von der Formalerschließung zum Metadatenmanagement II RDA,
Behandlung von ZDB-Daten mit RDA-Umstieg Stand:
Tps Kommissionierung tps tps Kommissionierung Lösung zum Kommissionieren und Erfassen von Aufträgen tps 2014.
RDA-Schulungen im OBV Erscheinungsdatum AG RDA Schulungsunterlagen – Modul 5 B: Erscheinungsdatum| Stand: Aleph-Version | CC BY-NC-SA2.
Eindeutige Personenzuordnung mit lokalen Identifiern via ODATA/LDAP
Optimierung von Geschäftsprozessen durch Webformulare und Webworkflow Rainer Driesen Account Manager.
Schulungsunterlagen der AG RDA Vertretungen der Öffentlichen Bibliotheken AG RDA Schulungsunterlagen - Modul GND: Werknormdatensätze - Vollumstieg Oktober.
Schulungsunterlagen der AG RDA Vertretungen der Öffentlichen Bibliotheken.
Basiskomponente Bibliothek Lokalsystem. Basiskomponente Bibliothek - LokalsystemRobert Scheuerl Folie 2 Basiskomponente Lokalsystem Projekt SOKRATES.
Key-Value Paare (KVP) - Metadaten für Kanäle speichern und nach MDF4 exportieren PM (V1.0)
GBIF NODES Committee Meeting Kopenhagen, Dänemark 4. Oktober 2009 Das GBIF Integrated Publishing Toolkit Alberto GONZÁLEZ-TALAVÁN Programme Officer für.
Anwendertreffen DPV 2015 Andreas Hungele DPV-Software 2015.
Nicht-lateinische Schriftzeichen Hinweise für die Erfassung
Basiskomponente Bibliothek Informationsveranstaltung
Datenbanken online sowie offline verfügbar machen
 Präsentation transkript:

CJK-Katalogisierung in Originalschrift - Arbeitsstand und Planungen - Brigitte Block und Günter Hupfer

Inhalt Austausch-/Erfassungsformat Setup ALEPH500: Format/Indizierung Arbeitsstand: Überblick Beispiele Perspektiven

Hintergrund: Datenformat Austauschformate: MARC21 und MAB2 "Datenmodell" für Mehrschriftlichkeit ein Datensatz, nicht mehrere Datensätze primäre Schrift, sekundäre Schrift Felder für sekundäre Schrift Wiederholung der Standard-Felder MARC21: Feld 880 MAB2: Feld 671 Sowohl MARC21 als auch MAB2 ermöglichen den Austausch einzelner Felder in unterschiedlichen Schriften. Die Originalschrift des Datensatzes ist dabei nicht festgelegt. Entsprechend ist es möglich, den Datensatz überwiegend originalschriftlich zu erfassen und nur die wichtigsten Felder zu transliterieren oder man verfährt genau umgekehrt.

ALEPH 500: Erfassung Standard-Client: Unicode Erfassungsformat: MAB2 oder MARC21 Austauschformat nicht für Erfassung und Indizierung in ALEPH 500 geeignet Varianten für mehrschriftl. Erfassung identische Felder: Spezifizierung durch Indikatoren/Unterfelder -> HBZ: abweichende Feldbezeichnungen Konverter für Austausch-/Internformat Für die originalschriftliche Erfassung kann der ALEPH-Standardclient genutzt werden, da dieser auf Unicode basiert. Allerdings werden darüber hinaus Hilfsmittel benötigt, die eine komfortable Erfassung von CJK-Schriftzeichen ermöglichen (s. hinten). Die originalschriftliche Erfassung ist prinzipiell an kein bestimmtes Erfassungsformat gebunden. Neben den Standardformaten MARC21 und MAB können auch spezielle Formate – wie z.B. CHIMARC für den chinesischen Sprachraum – genutzt werden. Da das Hochschulbibliothekszentrum einen gemeinsamen Katalog für Daten aus unterschiedlichen Sprachräumen anbieten möchte, ist von sprachbezogenen Spezialformaten abzuraten. Die Standardformate MARC21 und MAB bieten beide die Möglichkeit, das vollständige Katalogisat entweder originalschriftlich oder transliteriert zu erfassen, wobei einzelne Felder in einer abweichenden Schriftform hinterlegt werden können. Um die Erfassung und Indexierung originalschriftlicher Daten zu vereinfachen, wird das 880-Feld intern nicht verwendet. Stattdessen wird das Originalfeld wiederholt und mit den Unterfeldern in der abweichenden Schriftform gefüllt. Zusätzlich wird das Unterfeld $$6 als erstes Unterfeld erfasst, wobei lediglich die laufende Nummer zur Kennzeichnung der Zusammengehörigkeit vergeben wird. Beim Ex- und Import sorgen entsprechende Fix-Doc-Programme für die Umwandlung zwischen MAB21 und dem ALEPH-internen Format: MAB2: Für die Erfassung in MAB2 kann in ALEPH 500 für Feld 671 eine Lösung analog zu 880 implementiert werden.

HBZ-Erfassungsformat - 1 Standard-MAB2-Felder ohne Änderungen neue Felder für Originalschrift alphanummerische Feldnamen 1. Stelle MAB2 = Buchstabe (1 = A, 2 = B, 3 = C usw., 0 = Z) Beispiele: Feld 100 -> A00 Feld 331 -> C31 Indikatoren wie MAB2 Spezifische Unterfelder für Originalschrift UF 6: Schriftcode nach ISO 15924 UF 4: Vorkommen

HBZ-Erfassungsformat - 2 Reduzierter Feldumfang gegenüber MAB-Standard (erweiterbar) Umschrift MAB-Standard-Felder = Pflicht Selektionskennzeichen für CJK-Titeldaten Felder im Editor Sortierung der Felder jeweils nach dem Feld mit lateinischer Umschrift, nicht als Block am Ende des Datensatzes - Die Sortierung der OS-Felder ist vom HBZ konfigurierbar

Beispiele Felder A00 (1. Person) B00 (1. Körp.) C31 (Hauptsachtitel) C40, 341, 342 (Angaben zum 1. Parallelsachtitel) C35 (Zusatz zum HST) C59 (Verfasserangabe) D10 (Ort) D12 (Verlag) D51ff (Gesamttitel) GXX (inhaltl. Erschließung, ohne RSWK)

CJK: Indizierung Umschrift: Originalschrift: Zukunft: Standardindizes des hbz Originalschrift: Anforderung: Keine Auswirkungen auf bestehende Indizierung, spezifische Indizierungsroutinen Indizierung in eigenen CJK-Indizes: nicht spezifiziert nach CJK-Schriften Zukunft: spezifiziert nach CJK-Schriften: gefiltert anhand von Schriftcode in UF 6

CJK: Wortindizierung ExLibris-Routine „split_cjk“ Separierung von CJK-Zeichen: jedes Zeichen wird als ein Wort indiziert Zukunft: Chinesisches Wörterbuch Geeignet für chinesische Schriftzeichen: Oracle-Tabelle z113 Nicht geeignet für die Indizierung „gemischter“ CJK-Daten

CJK: Phrasenindizierung ExLibris-Routine cjk_pinyin Sortierung nach Pinyin und nicht nach Unicode-Wert Oracle-Tabelle z114: Konkordanz von Unicode-Zeichen zu Pinyin Zukunft: Alternative: cjk_stroke spezifische Routinen für chinesisch, japanisch, koreanisch

CJK: Zeicheneingabe Microsoft Windows: Input Method Editor Eingabe der Zeichen in Transliteration "übersetzt" vom IME nach CJK IMEs für die verschieden Sprachen Nachinstallation IME problemlos Systemsteuerung Regions-Sprachoptionen (Ländereinstellung) Eingabe

Arbeitsstand: Setup - 1 Integration der CJK-Daten in HBZ01 Erweiterung HBZ-ALEPH-Datenformat um spezifische Felder für Originalschriftlichkeit Felddefinitionen, Plausibilitäten Felder in lateinischer Umschrift bleiben weiterhin obligatorisch CJK-Sonderindizierung Anzeige der originalschriftlichen Felder im Client und im Web-Verbundkatalog

Arbeitsstand: Setup - 2 keine Auswirkungen auf bestehende MAB2-Exportschnittstellen d.h. kein Export der CJK-spezifischen Felder (KAT-Download, MAB-Dienst, Z39.50) Auswirkungen auf ALEPH-Lokalsysteme Replikation der CJK-Felder („Unterdrückung“ oder Setup-Übernahme hbz) Setup wird auf Schulungssystem zur Verfügung gestellt = Testsystem für Verbundbibliotheken Exportschnittstellen KAT-Download MAB2/MARC21 bisher noch nicht in UTF8 möglich Versorgung von Nicht-ALEPH-Lokalsystemen bisherige Datendienste: MAB2-Zeichensatz Entwicklung UTF8-Export MAB2/MARC21 Versorgung ALEPH-Lokalsysteme zentrale Erfassung MAB2 bzw. MARC21 hat Auswirkungen auf Replikation a) Information + Setup b) Konverter wenn MARC21

Test und weitere Arbeiten Test mit Pilot-/Testbibliotheken Setuparbeiten Konsolidierung des Setups Erweiterung Z39.50-Schnittstelle für MARC21-Daten mit CJK-Feldern Z39.50-Anbindung von NACSIS-CAT Konverter zu MAB2 notwendig

Beispiele Wie sieht es aus?

Katalogisierung: Editor Vorteile dieses Erfassungsformats ·        + schon an erster Stelle „Art“ des Feldes ersichtlich (Originalschrift) ·        + leichtere Identifikation des betr. Feldes ·        + Maskierung in ALEPH-Tabellen nach 1. Stelle = Originalschrift (ggf. Vorteile für leichtere Konfiguration) ·        + die geringsten Randbedingungen zum Produktionssystem (oftmals letzte Stelle eines Feldes bereits maskiert in MAB-Standard-Konfiguration) ·        +- eigene Feldsegmente für OS ·        +- klare Trennung der Setup-Einträge für MAB-Standard u. MAB-OS ·        - alphanummerische Feldbezeichnung „sprengt“ den Blick für die nummerische Sortierung Katalogisierung: Editor

Beispiel IME-Eingabe

Katalogisierung: Anzeige

Verbundkatalog: Anzeige

Arbeiten / Perspektiven Was ist noch zu tun? Welche weiteren Ziele haben wir?

Perspektiven –1- Weitere hbz-Bibliotheken Kundenanforderungen Exportschnittstellen weitere Fremddatenquellen CJK-Normdaten-Anbindung Originalschriftlichkeit außerhalb CJK CJK ist der "Schlüssel" z.B. arabische Schrift, hebräische Schrift

Perspektiven –2- Interessante Lösung auch für bislang Nicht-Verbundbibliotheken neue hbz-Kunden Kooperation mit ... ... Bibliotheken aus Nicht-hbz-Bereich ... anderen ALEPH-Verbünden Vision "CJK-Verbund"