Die Datentypen
- Normdaten zu Personen, Orten, Institutionen
- Kulturobjektdokumente (KOD)
- Beschreibungen
- Kataloge
- Digitalisate
Die Datenquellen
- Normdaten aus MM und Extrakt aus Beschreibungen
- Beschreibungen aus MM (MXML) und TEI-XML
- Digitalisierungsinformationen (IIIF und andere) in csv
- Katalog-Digitalisate (IIIF in UBL, einige noch nicht freigegeben)
- Katalog-OCR
Die Datenbearbeitung
- Vorab: Normierung der Minimaldaten (Ort, Bibliothek, Signatur) mit Umfrage und GND-Nachweis
- Wegen unterschiedlicher Beschreibungsformaten
Homogenisierung der Kerndaten (Titel, Schlagzeile, Form, Format, Buchschmuck, Musik)
- Zielformat: TEI (in HSP-Ausprägung, TEI-Issues)
Was fehlt, was kommt noch?
- Beschränkung vorläufig auf dt. Institutionen und Kataloge
- Kooperationen
- erneute Datenübernahme von e-codices, ÖNB, manuscripta.at
- Austausch mit Handschriftencensus, WZIS
- In Zukunft Datenaustausch mit Bibliothekssystemen (MARC-Schnittstelle)
Die nächsten Schritte
- Ablieferung der KOD-Daten an die GND
- Ontologien und kontrollierte Vokabulare für Schreibsprachen, Buchschmuck, usw.
<Ende/>