blog.arthistoricum.net

Open Data in den Geisteswissenschaften

Inzwischen haben wir uns auch in den Geisteswissenschaften an Begriff des „Open Access“ und den Implikationen, die damit einhergehen, gewöhnt. Open Access meint in erster Linie den freien Zugriff auf wissenschaftliche Publikationen. In den Naturwissenschaften ist daneben eine zweite Initiative entstanden, die sich unter der Bezeichnung „Open Data“ versammelt. Ziel ist die freie Zugänglichkeit zu wissenschaftlichen Primärdaten.

Mona Lisa

 

Mona Lisa im Louvre

Nun ist gerade in den Geisteswissenschaften eine exakte Definition von Primärdaten kaum möglich, wenn nicht gar unmöglich. Was als Primär-, Sekundär- oder gar Metadaten verstanden wird, hängt in einem Fach wie der Kunstgeschichte fast ausschließlich von der Betrachtungsperspektive auf die untersuchten Gegenstände ab. Das Objekt selbst ist im Zweifelsfall der einzige Primärdatenlieferant, weshalb in der Kunstgeschichte zyklisch die Rückbesinnung auf das Original eingefordert wird.

Doch wie steht es um den offenen Zugang auf die (visuellen) Primärdaten dieses vielbeschworenen Originals? De facto ist der volle Zugang auf diese Primärdatenquelle nur einer handvoll Auserwählten möglich. Allen anderen wird er (nicht nur) im musealen Umfeld durch sicherheitstechnische Maßnahmen wie Alarmanlagen, Absperrungen und Abdeckungen mit Sicherheitsglas oder konservatorisch bedingte Gegebenheiten wie eine nur schwache Beleuchtung erschwert. Man denke nur an solche Extrembeispiele wie die Hängung der „Mona Lisa“. Durch Öffnungszeiten (von Museen, Kirchen, Gedenkstätten etc.) ist der Zugang zeitlich reglementiert und durch die Macht des Faktischen örtlich gebunden. Das vergleichende Sehen ist vor dem Original wenn überhaupt nur in speziell vordefinierten Ausstellungssituationen möglich.

Hubble

 

Star-Birth Clouds in M16: Stellar

In den Naturwissenschaften werden als Primärdaten diejenigen Daten angesehen, die mit Hilfe technischer Instrumente „objektiv“ erfasst wurden. Ein Beispiel für solche Daten sind die Daten, die täglich vom Hubble-Teleskop an die Erdzentrale gesendet werden. Die spektakulären Bilder des Teleskops sind aus den Medien weitreichend bekannt und haben wesentlich zu einem positiven Ruf der Astronomie in der Öffentlichkeit beigetragen. Die Bilder sind das Endergebnis eines langwierigen Prozesses. Giga- und Terabytes an Primärdaten werden erst durch mehrfaches Filtern und Neuberechnen zu den bekannten, visuell ansprechenden Bildern verdichtet. Um aber auch die wissenschaftlich relevanteren Primärdaten im Sinne von Open Data zur Verfügung zu halten, muss ein hoher technischer und finanzieller Aufwand geleistet werden:

  • Teure und aufwendige Primärdatenerfassung
  • Anspruchsvolle Datenspeicherung
  • Keine einheitlichen Speicherformate
  • Schwer handhabbare Datenmengen
  • Aufwendige Verarbeitung
  • Komplexe Nachvollziehbarkeit

Primärdaten in der Kunstgeschichte

Auf diese Art interpretiert werden auch in der Kunstgeschichte immer mehr Primärdaten erzeugt. Gleichfalls mit technischen Instrumenten „objektiv“ erfasst werden Daten unter anderem bei der C14-Methode, bei der Laservermessung von Gebäuden und Objekten, bei chemischen Materialanalysen oder Röntgen- und Infrarotaufnahmen. Der naheliegende Fall, der sich mit dem Hubble-Beispiel vergleichen lässt, ist aber die Digitalfotografie. In der modernen Digitalfotografie werden vom Forschungsobjekt (visuelle) Rohdaten erzeugt, die dann für die allgemeine Verwendung gefiltert und konvertiert werden. Obwohl um Größenordnungen kleiner, wird hier ein vergleichbarer Aufwand betrieben, der aber einige Vorteile zeigt:

  • Vergleichsweise einfache Datenerfassung
  • Speichermenge relativ gering
  • Automatische Dokumentation der Aufnahmegegebenheiten (EXIF)
  • Standardisiertes, offenes Archivierungsformat für Rohdaten (DNG)
  • Etablierte, einheitliche Workflow-Verfahren
  • Leichte Nachvollziehbarkeit

Auch in diesem Fall sind die Primärdaten die wissenschaftlich relevanteren Daten. Ein noch so große JPG-Datei ist wenig interessant im Vergleich zu einer Rohdaten-Datei mit EXIF-Daten, anhand derer ich den Entstehungsprozess (welche Kamera, welche Brennweite, welcher Weissabgleich etc.) nachvollziehen kann, und mit eingebettetem Farbprofil, mit dessen Hilfe ich die Kalibrierung meiner Endgeräte vornehmen kann. In solchen Rohdaten von professionellen Kameras sind schon heute mehr Daten enthalten, als der menschliche Sinnesapparat erfassen kann.

Möglichkeiten

Braucht die Kunstgeschichte solche Primärdaten? Ja, denn alleine im visuellen Bereich sind die Nutzungsmöglichkeiten und Neuwertungen solcher Daten immens. Google Earth zeigt mit den Bildern aus dem Prado, wohin die Entwicklung gehen kann. In der Tat ist die Technik schon heute in der Lage, in einigen Bereichen mehr als die Anschauung des Originals zu leisten. Als Beispiel kann der Behaim Globus im Germanischen Nationalmuseum dienen: Über 99% der Kunsthistoriker/innen können dieses Objekt teils mit erheblichen Kosten- und Zeitaufwand ausschließlich bei sehr schwachen Licht betrachten. Zudem hält sie das Sicherheitsglas der Vitrine davon ab, sicher weniger als 50 cm dem Objekt zu nähern. Eine eingehende „Erfahrung“ des Objekts ist nicht möglich. Eine virtuelle Rekonstruktion mit heutiger Technik könnte eine weit detailliertere Wahrnehmung und immersivere Erfahrung des Objekts ermöglichen. Dabei ist man noch nicht einmal auf Spezialtechnik angewiesen.

 

3D-Monitor von LG

Geeignete Kameras verschlingen heutzutage keine Unsummen mehr, und die Speicherung der Datenmengen stellt angesichts etablierter Standards und günstig verfügbarer Geräte kein Problem mehr dar. Als Wiedergabegeräte bieten sich aktuelle 3D-Monitore an, die seit Jahren in der produzierenden Industrie zum Einsatz kommen und inzwischen für den Heimbedarf verfügbar sind. Als virtuelle, dreidimensionale Rekonstruktion auf einem farbechten 3D-Monitor könnte der Behaim-Globus weltweit, jederzeit in einer Art erfahrbar sein, die über die Erfahrung des Objekts in den faktischen Gegebenheiten weit hinausgeht. Das ist keine Science Fiction, sondern die derzeitige Science Reality.

Während in den Geisteswissenschaften noch ausschließlich über Open Access debattiert wird, bildet sich in den Naturwissenschaften das Modell des Open Science als Schnittmenge von Open Data und Open Access heraus. Eine Diskussion von Open Data wäre daher auch in den Geisteswissenschaften wünschenswert, um nicht den Anschluss zu verlieren. Angesichts der skizzierten Möglichkeiten muss zudem die Frage gestellt werden, ob das, was ist, überhaupt noch dem entspricht, was sein könnte.

 

 

(Das Magazin für Computertechnik C’T bietet in Ausgabe 11/2009, S. 154 ff. einen ausführlichen Hintergrundbereicht zu Open Science, der als Anregung für diesen Beitrag gedient hat.)

 

 

2 Kommentar(e)

  • Georg Hohmann
    18.07.2009 21:22

    Die Informationen zu CONA sind im Moment ja sehr spärlich. Ich lese das auch so, dass kulturelle Objekte "standardisiert" mit Metadaten versehen werden sollen. Zur Zwecke der Ordnung und Wiederauffindung mag das ja ganz ok sein, aber aus wissenschaftlicher/kunsthistorischer Sicht sehe ich das problematisch.

    Denn sind diese Metadaten (im Gegensatz zu "Primärdaten") denn überhaupt objektivierbar? Wenn man sich z. B ansieht, welche Geschichte Zu- und Abschreibungen von Werken im Falle Rembrandts haben, welche Position wird dann CONA vertreten? Sind dann alle Werke, die CONA als Rembrandts Werke markiert, ihm dann für immmer und ewig zugeschrieben? Und wenn nicht, wie funktioniert dann die Aktualisierung?

  • Laura Held
    07.07.2009 13:13

    Zu so etwas Superspannenden wie Primärdaten (oder eher Surrogate, auch wenn in dem Artikel vertreten wird, dass Surrogate=Stellvertreter mehr bieten können als das Original)gehören auch vernünftige Normdaten. Denn die Primärdaten müssen mit dem Objekt verknüpft werden, möglichst eindeutig, möglichst mehrsprachig, möglichst kompatibel.
    Gut, das demnächst zu den Getty Vocalularies (AAT, ULAN, TGN, etwa Schlagworte, Künstlernamen, Orte) auch noch CONA kommen soll, das kulturelle Objekte (Gemälde, Skulpturen, Bauwerke) mit Normdaten versieht - wenn ich es richtig verstanden habe.
    Da können dann direkt die Primärdaten mit verknüpft werden. Siehe:
    http://www.getty.edu/research/conducting_research/vocabularies/contribute.html#cona

Kommentar

Kontakt

Kommentar

Absenden