Die Datentypen

  • Normdaten zu Personen, Orten, Institutionen
  • Kulturobjektdokumente (KOD)
  • Beschreibungen
  • Kataloge
  • Digitalisate

Die Datenquellen

  • Normdaten aus MM und Extrakt aus Beschreibungen
  • Beschreibungen aus MM (MXML) und TEI-XML
  • Digitalisierungsinformationen (IIIF und andere) in csv
  • Katalog-Digitalisate (IIIF in UBL, einige noch nicht freigegeben)
  • Katalog-OCR

Die Datenbearbeitung

  • Vorab: Normierung der Minimaldaten (Ort, Bibliothek, Signatur) mit Umfrage und GND-Nachweis
  • Wegen unterschiedlicher Beschreibungsformaten
    Homogenisierung der Kerndaten (Titel, Schlagzeile, Form, Format, Buchschmuck, Musik)
  • Zielformat: TEI (in HSP-Ausprägung, TEI-Issues)

Was fehlt, was kommt noch?

  • Beschränkung vorläufig auf dt. Institutionen und Kataloge
  • Kooperationen
    • erneute Datenübernahme von e-codices, ÖNB, manuscripta.at
    • Austausch mit Handschriftencensus, WZIS
  • In Zukunft Datenaustausch mit Bibliothekssystemen (MARC-Schnittstelle)

Die nächsten Schritte

  • Ablieferung der KOD-Daten an die GND
  • Ontologien und kontrollierte Vokabulare für Schreibsprachen, Buchschmuck, usw.

<Ende/>