Museumsdaten – Lessons learned

Im vergangenen Jahr haben wir am Kultur-Hackathon „Coding Davinci“ Nord teilgenommen und uns über Preise für „Best use of data“ und „Technical excellence“ freuen dürfen. Für die Projekte haben wir offene Kulturdaten von Museen verwendet. Hier das Feedback dazu.

Digitalisierung von Museumsdaten

Die Digitalisierung ist nicht nur in Wirtschaft ein Schwerpunktthema. Auch in Museen werden Bestände digitalisiert und Daten über Exponate digital zusammen getragen, sodass neue Formen von Arbeit mit den Exponaten und dem Wissen über sie, aber auch neue Formen der Verwendung bis hin zu neuen digitalen Geschäftsmodellen für Museen möglich werden. Dabei ist es offenbar ein Großes Thema, in welcher Form, mit welchen Prozessen und wohin Museen Daten bereitstellen können. Im Rahmen von Initiativen wie der eCulture Agenda 2020 in Hamburg bemühen sich Museen und Kulturinstitutionen um tragfähige Konzepte zur Digitalisierung ihrer Bestände.

Inhalt

Museumsdaten?

Bei den Daten handelt es sich um Fotos von Exponaten, aber oft noch viel Wichtiger die Metadaten. Metadaten, das sind Informationen, die zu den Exponaten gesammelt wurden. Dazu zählen beschreibende Informationen, etwa über Alter, Herkunft, Verbleib, Größe, Beschaffenheit, Aussehen, zur Geschichte des Exponats, Besitzrechten uns zu weiteren wissenschaftlichen Erkenntnissen, welche über das Exponat verfügbar sind. Museumsdaten liegen mehrheitlich in textueller Form vor, es können aber auch Bildformate wie dokumentierende Fotos und Zeichnungen, Audiodateien, Karten, in seltenen Fällen aber auch sehr komplexe Datenformate wie z.B. CT Scans sein. Besondere Vorteile an digitalisierten Datenbeständen sind insbesondere die leichte Durchsuchbarkeit und die überregionale Verfügbarkeit, die Wissenschaftlern, Kuratoren und Personen mit Interesse an den Objekten ermöglicht, weltweit thematisch passende Exponate aufzufinden.

Persönlicher Bezug, persönliche Motivation

Im Rahmen des Kultur-Hackathons „Coding Davinci Nord“ haben Museen aus Hamburg und Norddeutschland sowie Teilnehmer mit offenen Daten experimentiert. Ich beschreibe hier die daraus entstandenen Erfahrungen, Erkenntnisse und Wünsche aus der Perspektive des Programmierers und Nutzers der Daten in der Hoffnung, dass sie bei der Gestaltung zukünftiger Formen von Speicherung und Bereitstellung von Museumsdaten und Kulturdaten helfen mögen.

Anforderungen an Verwaltung von Museumsdaten

Im Folgenden liste ich die Anforderungen in Form sogenannter User-Stories auf. User Stories sind gut geeignet um Anforderungen zu beschreiben, da sie neben der Anforderung selbst die Information enthalten, wer die Anforderung hat und welcher Nutzen durch die Umsetzung der Anforderung für die Person entsteht. Meine Anforderungen betreffen fongende Personenkreise (Rollen):

  • Nutzer: Generell alle Nutzer der Daten
  • Einfacher Nutzer: Nutzer ohne Fachwissen, ggf. mit geringer Computererfahrung
  • Programmierer: Personen mit entsprechender Ausbildung, welche die Daten auf einem technisch professionellen Niveau nutzen z.B. im Auftrag bestimmter Institutionen
  • Unerfahrene Programmierer: Hobbyprogrammierer, Personen mit wenig Programmiererfahrung, die dennoch Projekte mit den Daten umsetzen möchten. Beispielsweise Künstler, Jugendliche, Teilnehmer von Programierwettbewerben

Anforderungen an Auffindbarkeit und einfache Nutzbarkeit

Die gesamte Arbeit zur Erfassung von Daten macht je mehr Sinn, desto intensiver die Daten später auch genutzt werden. Dazu gehört zunächst, dass die Daten überhaupt gefunden werden. Leichte Nutzbarkeit ist ein Kriterium, dass sehr von der Perspektive der Nutzer und deren jeweiligen Anforderungen abhängt. So ist es für Wissenschaftler einfach, wenn sie sehr präzise Daten in speziellen maschinenlesbaren Standards für die Nutzung in Spezialsoftware vorliegen haben, für andere könnte eine übersichtliche und verständliche Form z.B. als Textdatei oder PDF einfach nutzbar sein.

  • Als Nutzer möchte ich die Daten über Suchmaschinen im Internet finden können, sodass ich einfach von der Existenz der Daten erfahren kann.
  • Als Nutzer möchte ich die Daten unter möglichst vielen Schlagwörtern finden können, sodass ich die Daten mit meinem jeweiligen fachbezogenen oder fachfremden Vokabular finden kann.
  • Als internationaler Nutzer möchte ich die Daten in englischer Sprache vorliegen haben, damit ich diese ohne Übersetzung direkt nutzen kann.
  • Als Nutzer möchte ich beschreibende Informationen zu jedem Metadatenfeld haben, sodass ich dessen Bedeutung und Sinn und ggf. Format verstehen kann.
  • Als Nutzer möchte ich eine Filterfunktion haben, sodass ich mir über die Metadaten nur die Datensätze auswählen kann, die ich benötige.
  • Als Nutzer möchte ich die Metadaten ausblenden können, die ich nicht benötige, damit mein Datensatz nur Dinge enthält, die ich benötige.
  • Als Nutzer möchte ich eine Vorschau der Daten haben, damit ich sehen kann, welche Daten mein Datensatz enthalten wird.
  • Als einfacher Nutzer möchte ich die Daten in einem einfach zu lesenden und weit verbreitenden Format (z.B. PDF, Excel/CSV) herunterladen können, damit ich ohne spezielle Kenntnisse und spezielle Software die Datensätze nutzen kann.
  • Als Programmierer möchte ich die Daten als XML Format haben, sodass ich die Daten schnell und ohne Zeitverlust durch Aufbereitung in meinem Projekt nutzen kann, weil nahezu alle Programmierumgebungen XML unterstützen.
  • Als unerfahrener Programmierer möchte ich die Daten als JSON Format haben, sodass ich die Daten schnell und ohne Zeitverlust durch Aufbereitung in meinem Web Projekt oder meiner App nutzen kann, ohne das Wissen zu haben, wie ich Datensätze in XML selektieren oder XML in JSON umwandle.
  • Als Programmierer möchte ich die Daten als Datenbank Dump (SQL) haben, damit ich ohne Zeitverlust durch Aufbereitung die Daten in eine Datenbank importieren kann.
  • Als Nutzer möchte ich alle oder ausgewählte Datensätze komprimiert als zip herunterladen können sodass ich größere Datenmengen oder viele Dateien schnell und unkompliziert herunterladen kann.
  • Als  Nutzer möchte ich Daten unkomprimiert herunter laden können sodass ich auch einzelne Datensätze laden kann ohne gleich alle Datensätze herunterladen zu müssen.
  • Als Nutzer möchte ich bei Datensätzen mit Bildern die Auflösung für den Download auswählen können, sodass ich im Fall, dass ich nur kleine Bilder benötige, keine riesigen Datenmengen herunterladen und die Bilder später verkleinern muss oder im entgegengesetzten Fall gleich große Bilder bekomme, wenn ich diese benötige.
  • Als Nutzer möchte ich sehr große Datensätze mit BitTorrent herunterladen können, sodass ich bei Verbindungsabbrüchen nicht die ganze Datei nochmal herunterladen muss.
  • Als Nutzer möchte ich eine anwenderfreundliche Oberfläche zur Nutzung von Suche, Filter, Vorschau, Metadateninfos und Download der Daten haben, sodass ich schnell und bequem meine Daten finden, zusammenstellen und herunterladen kann.
  • Als Nutzer möchte ich eine anwenderfreundliche Web-Oberfläche haben, die mit beliebigen Computern (ggf. auch mobilen Endgeräten) mit beliebigen Betriebssystemen genutzt werden kann, sodass jeder überall auf die Daten zugreifen kann.
  • Als Programmierer möchte ich alle Daten in allen Formaten mit Suche und Filter aus einer API (Programmierschnittstelle) beziehen können, sodass meiner Anwendung stets die neuesten Datensätze zur Verfügung stehen und ich bei Änderungen am Datenbestand nicht jedes mal die Daten von Hand herunterladen und in mein System einpflegen muss.

Anforderungen an Bearbeitbarkeit der Daten

Bei der Nutzung der Daten fallen oft Fehler in den Datensätzen auf, die dann vom Nutzer korrigiert werden. Das Spektrum der Museen ist sehr breit. Manche Museen sind in Sachen Digitalisierung sehr professionell aufgestellt und verfügen über umfangreiche Ressourcen die sich genau mit den digitalen Formaten auskennen und damit, wie man sie erstellt. Andere Museen, oft kleinere, haben sehr engagierte Mitarbeiter die sich nach Kräften in die Materie einarbeiten und nach ihren Möglichkeiten Bestände digitalisieren. Auch der Anspruch der jeweiligen Institution kann ganz frei von Größe und Wissen ein ganz anderer sein. Die Qualität der Datenbestände ist daher sehr unterschiedlich. Bei der Verwendung der Datensätze werden daher öfter Datensätze repariert, erweitert oder in neue oder andere Formate überführt, manchmal entstehen im Zuge der Verwendung neue Metadaten die sehr wertvoll für andere sein können. Aus diesem Grund muss es auch die Möglichkeit geben, dass Nutzer der Daten die Datenbestände bearbeiten und ergänzen können. Natürlich muss eine fachliche Prüfung solcher Änderungen erfolgen. Dies lässt bei Museen schnell die Angst entstehen, dass für diese Prüfung Personaleinsatz nötig ist und weitere Kosten entstehen. Modelle wie Wikipedia aber auch GitHub zeigen jedoch, dass dies nicht der Fall sein muss. So ist es möglich, dass Nutzer Änderungen am Datensatz als Vorschlag hochladen. Den Vorschlag sehen dann auch die anderen Nutzer. Jede vorgeschlagene geänderte Version enthält einen Kommentartext dazu, warum die Änderung vorgeschlagen wurde. Nutzer können entscheiden, ob sie die Originalversion oder eine vorgeschlagene, als noch ungeprüft gekennzeichnete Version mit kommentierten Änderungen verwenden möchten. Museen können auf diese Weise sehr von der Arbeit Anderer mit den Daten profitieren.

  • Als Nutzer möchte ich kaputte oder fehlerhafte Datensätze die ich korrigiert habe wieder zurück ins System hochladen können, sodass andere Nutzer nicht die selbe Arbeit nochmal machen müssen.
  • Als Nutzer möchte ich von mir erstellte, zusätzliche Metadaten mit Relevanz für andere zurück ins System hochladen können, sodass andere von meinen Daten profitieren können.
  • Als Nutzer möchte ich beim Hochladen von Änderungen mit einem geführten Dialog Schritt für Schritt geführt werden, sodass für die anderen Nutzer sichergestellt ist, dass der von mir hochgeladene Datensatz eine hohe Qualität hat, ich alle Felder richtig ausgefüllt habe und Nutzer sehen können, wer aus welchem Grund diese Änderung gemacht hat und worin genau die Änderung besteht.

Lizensierung, Nutzungsrechte, Bedeutung offener Daten

Die Verwendung bzw. Nutzung von Kulturdaten unterliegt der Wahrung von Nutzungs- und Urheberrechten. Ziel der Datenerfassung ist am Ende, dass möglichst viele die Kulturdaten nutzen  – kommerziell oder nichtkommerziell. Die rechtliche Seite ist hier oft ein Hindernis, dass mit guter Dokumentation der Nutzungsrechte und Lizenzen aber auch Hinweisen und Anleitungen zur richtigen Nutzung und Lizensierung abgebaut werden kann und sollte. Nicht jeder, der Kulturdaten nutzen möchte, ist in diesen Themen firm.

Teilhabe und Zusammenarbeit wird insbesondere dann gefördert, wenn Daten zur freien Nutzung als offene Daten zur Verfügung gestellt werden. Coding Davinci Nord gezeigt dass die Öffnung der Datenbestände zu neuen Formen der Nutzung führt und den Exponaten neue Relevanz und Beachtung geben kann. Ich persönlich glaube, dass offene Daten die vielversprechendste, innovativste und zukunftsträchtigste Form der Nutzung von Kulturdaten darstellen und hoffe, dass mehr Kulturinstitutionen diesen Weg einschlagen.

 

Diesen Artikel teilen

One thought on “Museumsdaten – Lessons learned

  1. Hey vielen Dank für die Initiative (!), warum nicht noch den Entstehungskontext „deiner“ Gedanken hinzufügen (habe es als eine konstruktive Runde und ein produktives Pausengespräch im Rahmen des Körberforums Offene Stadt erlebt, gemeinsam mit Vertretern des Museums für Kunst und Gewerbe Hamburg, des Instituts für Volkskunde/Kulturanthropologie der Universität Hamburg, Coding da Vinci Nord (CDVNord) und der Open Knowledge Foundation Deutschland (OKF_de)) und darauf verweisen, dass die Diskussion auf der Tagung „Sharing is Caring – Hamburg Extension“ im Workshop der OKF_de und CDVNord im April weitergeführt wird, mit dem Ziel, ein kollaboratives offenes Handbuch anzustoßen?! Interessierte #openGLAMs sind herzlich eingeladen, zur Diskussion über die Tagung #sharecarex hinaus beizutragen (siehe Link). Danke!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.