blog.arthistoricum.net

Berliner Gespräch zur Digitalen Kunstgeschichte

In der Reihe „Berliner Gespräche zur Digitalen Kunstgeschichte“ des Instituts für Kunst- und Bildgeschichte der Humboldt-Universität zu Berlin wurden am 8.5.13 unter dem Titel "Alles in Ordnung?" Fragen zu Vokabularen und Klassifikationen diskutiert. 

In der hiesigen Informatik der FU Berlin beschäftigen wir uns seit bald 10 Jahren mit Technologien des Semantic Web. Es war interessant, zu sehen wie sich die Fragen die wir aus technischer Sicht und im Hinblick auf Informationssysteme stellen, in ganz anderem Kontext aber dennoch ähnlich für Sammlungen und Museen ergeben. Während wir Ordnungssysteme verwenden um z.B. virtuelle Datenspeicherung zu optimieren, haben Klassifikationen in Bibliotheken die physische Konsequenz des Regalplatzes eines Buches.

Einige der Grundüberlegungen bei der Erstellung von Klassifikationen und Ontologien im Semantic Web fanden sich als Desiderat oder neue Feststellung in den Diskussionen wieder. Vielleicht ist es nützlich sie erneut explizit zu benennen und in den Kontext des Umgangs mit Klassifikationen und Daten in der Digitalen Kunstgeschichte zu stellen. Der Web-Erfinder Tim Berners-Lee hat verschiedene Prinzipien für den Aufbau von Linked Data genannt.

 

Use URIs as names for things
Use HTTP URIs so that people can look up those names.

Damit ist gemeint dass alles durch elektronisch auflösbare Netzbezeichner - die vom Web bekannten URLs - benannt wird. Dies betrifft auch physische Artefakte wie sie in einer Sammlung auftreten. Das was bislang eine Inventarnummer war soll also zu einem Netzbezeichner werden. Dies ist leicht möglich: ein intern eindeutiger Bezeichner wird an eine URLs der Institution angehängt.

Mit diesem simplen Vorgang trennt man z.B. Klassifikation und Standort. Beide können getrennt voneinander notiert werden indem sie sich auf die URL beziehen. Die in einer Klassifikation definierten Klassen benötigen eine URL, also z.B. "http://rzbvm001.uni-regensburg.de/sepp/rvko_neu/mytree.phtml?nt_s=LE+5121 hat den Namen 'Plastik'". Die Aussage "http://xyz.museum/sammlung/234.21.2 ist eine http://rzbvm001.uni-regensburg.de/sepp/rvko_neu/mytree.phtml?nt_s=LE+5121" lässt sich nun notieren, aber natürlich auch "http://xyz.museum/sammlung/234.21.2 befindet sich im Raum ‍xyz.museum/raeume/1024".

So kann man also Klassifikation und Standort leicht trennen. Auch die auf der Veranstaltung angesprochene Versionierungsproblematik bei sich ändernden Klassifikationen lässt sich lösen. Dazu müssen die URLs persistent sein, sich also nicht ändern. Eine geänderte Klassifikation erzeugt also neue URLs und gleichzeitig muss die Änderung selber als Beziehung zwischen alter und neuer URL notiert sein.

Schließlich ermöglicht diese Trennung auch die Existenz mehrerer Klassifikationen kollisionsfrei. Niemand ist gehindert, gleichzeitig zu notieren: "http://xyz.museum/sammlung/234.21.2 ist eine meine.klassifikation.de/skulptur".

In den Sprachen des Semantic Web wird immer von mehreren Klassifikationen ausgegangen, deren Klassen mit dem Element "sameClassAs" als identisch markiert werden können. Und dies kann auch nachträglich an anderer Stelle notiert sein. An die Stelle einer exklusiven umfassenden Klassifikation tritt also die Integration vieler vorhandener und sich überlappender Klassifikationen. Technisch gilt die "open world assumption": Neben dem was man selber aussagt oder sieht können weitere Aussagen in der Welt existieren.

 

When someone looks up a URI, provide useful information, using the standards (RDF*, SPARQL)

 

Das bedeutet dass über die URLs etwas für Menschen und Maschinen Nützliches abrufbar sein soll. Für Maschinen wäre dies z.B. ein verarbeitbarer Datensatz; für Menschen vielleicht eine Abbildung einer Skulptur oder eine textuelle Beschreibung des Konzepts der Klassifikation. Es genügt also nicht etwa, sich auf eine Klassifikation zu verständigen und diese dann als PDF Dokument ins Netz zu stellen.  Je offener und verarbeitbarer man die Klassifikation in dieser Hinsicht verteilt, umso stärker tritt ein Netzwerkeffekt ein. Je mehr eine Klassifikation verwendet wird, umso höher ist der Anreiz zu ihrer Verwendung. Und je öfter sie benutzt wird umso wertvoller ist eine Klassifikation. Die auf der Tagung aufgeworfene Frage nach Schutzmöglichkeiten für Taxonomien deutet somit in die falsche Richtung.

Weiterhin betont die Empfehlung die Verwendung von Standards. Diese liegen mittlerweile als ausdrucksmächtige Sprachen vor. Es ist kaum notwendig, eigene XML-Dialekte zu erfinden um Daten herauszugeben. Die Definition eines eigenen Formats ergibt vielmehr "bewegliche Datensilos" bei denen zu befürchten ist dass sie lediglich dem Import in andere Datensilos dienen. An die Stelle eines Exportformats sollte eine Programmierschnittstelle treten 

 

Include links to other URIs. so that they can discover more things.

 

Diese Empfehlung ist der Kern der Vernetzungsidee im Web und nun auch im Web der Daten. Die angesprochenen Datensilos entziehen sich der Verlinkung indem sie keine auflösbaren URLs verwenden und selber keine Verweise enthalten. Der Datenbestand wird aber dann wertvoll wenn er verlinkt werden kann. Und auch hier entsteht wieder der genannte Netzwerkeffekt.

Der auf der Tagung ausgesprochene Wille, Daten die mit öffentlichen Mitteln erstellt wurden, auch öffentlich bereit zu stellen nimmt diesen Gedanken auf. Die dazu wenigen notwendigen technischen Schritte zu gehen sollte nicht so schwer sein.

Die auch geäußerte Einsicht dass die Erstellung und Pflege von Klassifikationen immer Teamwork ist entspricht der Netzwerkidee. Mit dem Internet wird die Vorstellung zentraler Einrichtungen die Wissen tragen aufgelöst. Gefordert ist dezentrale Kollaboration. Die technischen Mittel dazu stehen heute zur Verfügung - es bedarf der Entschiedenheit sie in gewandelten digitalen Strukturen einzusetzen.

0 Kommentar(e)

Kommentar

Kontakt

Kommentar

Absenden