Die Präsentation wird geladen. Bitte warten

Die Präsentation wird geladen. Bitte warten

CJK-Katalogisierung in Originalschrift - Arbeitsstand und Planungen -

Ähnliche Präsentationen


Präsentation zum Thema: "CJK-Katalogisierung in Originalschrift - Arbeitsstand und Planungen -"—  Präsentation transkript:

1 CJK-Katalogisierung in Originalschrift - Arbeitsstand und Planungen -
Brigitte Block und Günter Hupfer

2 Inhalt Austausch-/Erfassungsformat Setup ALEPH500: Format/Indizierung
Arbeitsstand: Überblick Beispiele Perspektiven

3 Hintergrund: Datenformat
Austauschformate: MARC21 und MAB2 "Datenmodell" für Mehrschriftlichkeit ein Datensatz, nicht mehrere Datensätze primäre Schrift, sekundäre Schrift Felder für sekundäre Schrift Wiederholung der Standard-Felder MARC21: Feld 880 MAB2: Feld 671 Sowohl MARC21 als auch MAB2 ermöglichen den Austausch einzelner Felder in unterschiedlichen Schriften. Die Originalschrift des Datensatzes ist dabei nicht festgelegt. Entsprechend ist es möglich, den Datensatz überwiegend originalschriftlich zu erfassen und nur die wichtigsten Felder zu transliterieren oder man verfährt genau umgekehrt.

4 ALEPH 500: Erfassung Standard-Client: Unicode
Erfassungsformat: MAB2 oder MARC21 Austauschformat nicht für Erfassung und Indizierung in ALEPH 500 geeignet Varianten für mehrschriftl. Erfassung identische Felder: Spezifizierung durch Indikatoren/Unterfelder -> HBZ: abweichende Feldbezeichnungen Konverter für Austausch-/Internformat Für die originalschriftliche Erfassung kann der ALEPH-Standardclient genutzt werden, da dieser auf Unicode basiert. Allerdings werden darüber hinaus Hilfsmittel benötigt, die eine komfortable Erfassung von CJK-Schriftzeichen ermöglichen (s. hinten). Die originalschriftliche Erfassung ist prinzipiell an kein bestimmtes Erfassungsformat gebunden. Neben den Standardformaten MARC21 und MAB können auch spezielle Formate – wie z.B. CHIMARC für den chinesischen Sprachraum – genutzt werden. Da das Hochschulbibliothekszentrum einen gemeinsamen Katalog für Daten aus unterschiedlichen Sprachräumen anbieten möchte, ist von sprachbezogenen Spezialformaten abzuraten. Die Standardformate MARC21 und MAB bieten beide die Möglichkeit, das vollständige Katalogisat entweder originalschriftlich oder transliteriert zu erfassen, wobei einzelne Felder in einer abweichenden Schriftform hinterlegt werden können. Um die Erfassung und Indexierung originalschriftlicher Daten zu vereinfachen, wird das 880-Feld intern nicht verwendet. Stattdessen wird das Originalfeld wiederholt und mit den Unterfeldern in der abweichenden Schriftform gefüllt. Zusätzlich wird das Unterfeld $$6 als erstes Unterfeld erfasst, wobei lediglich die laufende Nummer zur Kennzeichnung der Zusammengehörigkeit vergeben wird. Beim Ex- und Import sorgen entsprechende Fix-Doc-Programme für die Umwandlung zwischen MAB21 und dem ALEPH-internen Format: MAB2: Für die Erfassung in MAB2 kann in ALEPH 500 für Feld 671 eine Lösung analog zu 880 implementiert werden.

5 HBZ-Erfassungsformat - 1
Standard-MAB2-Felder ohne Änderungen neue Felder für Originalschrift alphanummerische Feldnamen 1. Stelle MAB2 = Buchstabe (1 = A, 2 = B, 3 = C usw., 0 = Z) Beispiele: Feld 100 -> A00 Feld 331 -> C31 Indikatoren wie MAB2 Spezifische Unterfelder für Originalschrift UF 6: Schriftcode nach ISO 15924 UF 4: Vorkommen

6 HBZ-Erfassungsformat - 2
Reduzierter Feldumfang gegenüber MAB-Standard (erweiterbar) Umschrift MAB-Standard-Felder = Pflicht Selektionskennzeichen für CJK-Titeldaten Felder im Editor Sortierung der Felder jeweils nach dem Feld mit lateinischer Umschrift, nicht als Block am Ende des Datensatzes - Die Sortierung der OS-Felder ist vom HBZ konfigurierbar

7 Beispiele Felder A00 (1. Person) B00 (1. Körp.) C31 (Hauptsachtitel)
C40, 341, 342 (Angaben zum 1. Parallelsachtitel) C35 (Zusatz zum HST) C59 (Verfasserangabe) D10 (Ort) D12 (Verlag) D51ff (Gesamttitel) GXX (inhaltl. Erschließung, ohne RSWK)

8 CJK: Indizierung Umschrift: Originalschrift: Zukunft:
Standardindizes des hbz Originalschrift: Anforderung: Keine Auswirkungen auf bestehende Indizierung, spezifische Indizierungsroutinen Indizierung in eigenen CJK-Indizes: nicht spezifiziert nach CJK-Schriften Zukunft: spezifiziert nach CJK-Schriften: gefiltert anhand von Schriftcode in UF 6

9 CJK: Wortindizierung ExLibris-Routine „split_cjk“
Separierung von CJK-Zeichen: jedes Zeichen wird als ein Wort indiziert Zukunft: Chinesisches Wörterbuch Geeignet für chinesische Schriftzeichen: Oracle-Tabelle z113 Nicht geeignet für die Indizierung „gemischter“ CJK-Daten

10 CJK: Phrasenindizierung
ExLibris-Routine cjk_pinyin Sortierung nach Pinyin und nicht nach Unicode-Wert Oracle-Tabelle z114: Konkordanz von Unicode-Zeichen zu Pinyin Zukunft: Alternative: cjk_stroke spezifische Routinen für chinesisch, japanisch, koreanisch

11 CJK: Zeicheneingabe Microsoft Windows: Input Method Editor
Eingabe der Zeichen in Transliteration "übersetzt" vom IME nach CJK IMEs für die verschieden Sprachen Nachinstallation IME problemlos Systemsteuerung Regions-Sprachoptionen (Ländereinstellung) Eingabe

12 Arbeitsstand: Setup - 1 Integration der CJK-Daten in HBZ01
Erweiterung HBZ-ALEPH-Datenformat um spezifische Felder für Originalschriftlichkeit Felddefinitionen, Plausibilitäten Felder in lateinischer Umschrift bleiben weiterhin obligatorisch CJK-Sonderindizierung Anzeige der originalschriftlichen Felder im Client und im Web-Verbundkatalog

13 Arbeitsstand: Setup - 2 keine Auswirkungen auf bestehende MAB2-Exportschnittstellen d.h. kein Export der CJK-spezifischen Felder (KAT-Download, MAB-Dienst, Z39.50) Auswirkungen auf ALEPH-Lokalsysteme Replikation der CJK-Felder („Unterdrückung“ oder Setup-Übernahme hbz) Setup wird auf Schulungssystem zur Verfügung gestellt = Testsystem für Verbundbibliotheken Exportschnittstellen KAT-Download MAB2/MARC21 bisher noch nicht in UTF8 möglich Versorgung von Nicht-ALEPH-Lokalsystemen bisherige Datendienste: MAB2-Zeichensatz Entwicklung UTF8-Export MAB2/MARC21 Versorgung ALEPH-Lokalsysteme zentrale Erfassung MAB2 bzw. MARC21 hat Auswirkungen auf Replikation a) Information + Setup b) Konverter wenn MARC21

14 Test und weitere Arbeiten
Test mit Pilot-/Testbibliotheken Setuparbeiten Konsolidierung des Setups Erweiterung Z39.50-Schnittstelle für MARC21-Daten mit CJK-Feldern Z39.50-Anbindung von NACSIS-CAT Konverter zu MAB2 notwendig

15 Beispiele Wie sieht es aus?

16 Katalogisierung: Editor
Vorteile dieses Erfassungsformats ·        + schon an erster Stelle „Art“ des Feldes ersichtlich (Originalschrift) ·        + leichtere Identifikation des betr. Feldes ·        + Maskierung in ALEPH-Tabellen nach 1. Stelle = Originalschrift (ggf. Vorteile für leichtere Konfiguration) ·        + die geringsten Randbedingungen zum Produktionssystem (oftmals letzte Stelle eines Feldes bereits maskiert in MAB-Standard-Konfiguration) ·        +- eigene Feldsegmente für OS ·        +- klare Trennung der Setup-Einträge für MAB-Standard u. MAB-OS ·        - alphanummerische Feldbezeichnung „sprengt“ den Blick für die nummerische Sortierung Katalogisierung: Editor

17 Beispiel IME-Eingabe

18 Katalogisierung: Anzeige

19 Verbundkatalog: Anzeige

20 Arbeiten / Perspektiven
Was ist noch zu tun? Welche weiteren Ziele haben wir?

21 Perspektiven –1- Weitere hbz-Bibliotheken Kundenanforderungen
Exportschnittstellen weitere Fremddatenquellen CJK-Normdaten-Anbindung Originalschriftlichkeit außerhalb CJK CJK ist der "Schlüssel" z.B. arabische Schrift, hebräische Schrift

22 Perspektiven –2- Interessante Lösung auch für bislang Nicht-Verbundbibliotheken neue hbz-Kunden Kooperation mit ... ... Bibliotheken aus Nicht-hbz-Bereich ... anderen ALEPH-Verbünden Vision "CJK-Verbund"


Herunterladen ppt "CJK-Katalogisierung in Originalschrift - Arbeitsstand und Planungen -"

Ähnliche Präsentationen


Google-Anzeigen