Beitrag

Jenseits von HTML und Browser: Neue Perspektiven auf »Sandrart.net«

Das DFG-Projekt »Sandrart.net« ging vor einigen Tagen in den letzten Monat seiner Projektlaufzeit. Fragestellungen wie die nach der Verstetigung und Nachnutzung rücken somit stärker in den Vordergrund. Anders als noch vor wenigen Jahren sind die Verfügbarhaltung von Projektergebnissen und ggf. die Veröffentlichung entstandener Software aber nicht mehr die einzigen Ziele; vielmehr steigt mittlerweile auch in den Geisteswissenschaften die Wertschätzung für ›rohe‹ Daten und entsprechend stellt sich für ein Projekt wie das unsrige die Aufgabe, die entstandenen Daten nicht nur für den Betrieb unserer Plattform einzusetzen, sondern diese idealerweise auch eigenständig zu publizieren und somit für Dritte nutzbar zu machen.

 

Als der Förderantrag für das Projekt – eine informationstechnisch erschlossene Online-Edition der drei Bände von Joachim von Sandrarts »Teutschen Academie« aus dem späten 17. Jahrhundert – vor etwa sechs Jahren fertiggestellt wurde, war das Semantic Web noch immer Theorie und von Linked Open Data war keine Rede. Naturgemäß war das Veröffentlichen von Daten daher kein Ziel des Projektes. Ungeachtet dessen begannen wir aber  aus anderen Gründen bereits früh damit, einerseits Normdaten (zunächst PND, ULAN, TGN) zu referenzieren und andererseits Bezüge zwischen Datensätzen über Tripel (also auf eine dem Semantic Web entsprechende Weise) zu formulieren.

 

Je mehr die Linked-Open-Data-Bewegung an Fahrt aufnahm und je mehr damit zusammenhängende Projekte aus dem Kulturerbe-Bereich neue Möglichkeiten eröffneten (so etwa Erlangen CRM, eine Implementierung des CIDOC CRM mit den Mitteln des Semantic Webs), desto deutlicher wurde, dass das Publizieren unserer Daten nicht nur theoretisch wünschenswert wäre, sondern auch praktisch umsetzbar und sinnvoll ist. Und immerhin boten unsere Daten sowohl inhaltlich als auch von ihrer Struktur bereits eine ausgesprochen gute Ausgangslage.

 

Ein erster Schritt war die Implementierung einer Web-API (vgl. http://ta.sandrart.net/editionsinformationen/services/rest/), die in REST-artiger Weise angesprochen werden kann und die wahlweise XML oder JSON zurückliefert. Zwar ist sowohl die API selbst als auch das Rückgabeformat proprietär, kann aber mit Identifiern einiger bekannter Vokabularien verwendet werden, so dass wir meinen, dass eine tatsächliche Nutzbarkeit für andere Projekte gegeben ist.

 

Seit Februar 2011 publizieren wir ferner Linked Open Data im engeren Sinne (http://ta.sandrart.net/editionsinformationen/services/linked-open-data-rdf/), d.h. RDF-Daten, die auf verbreitete Ontologien referenzieren (neben dem bereits erwähnten Erlangen CRM u.a. PND/GND, GeoNames, FOAF) und unter einer offenen Lizenz angeboten werden. Anders als die REST-API, die nach dem bekannten Klassifikations-Schema von Tim Berners-Lee (http://www.w3.org/DesignIssues/LinkedData.html) lediglich zwei Sterne erhielte, erfüllen unsere RDF-Daten alle fünf Kriterien.

Natürlich gibt es nicht für all unsere Daten sinnvolle Möglichkeiten, sie mit vertretbarem Aufwand mit den Mitteln des Semantic Webs zu formulieren. Dennoch meinen wir, mit diesen Daten, so unvollkommen sie sind, bereits jetzt einen Nutzwert bieten zu können. Denn unserem Verständnis nach funktioniert Linked Open Data ähnlich wie eine Bottle-Party: es gibt niemanden, der alles bereitstellt, sondern viele tragen jeweils einen kleinen Teil bei – und doch ist das Ganze mehr als die Summe der einzelnen Teile.

 

In der Summe bieten diese beiden Angebote eine Reihe von Möglichkeiten, die von uns angebotenen Daten anderweitig zu verwenden. Diese reichen von der kontextuellen Anreicherung eigener Inhalte bis hin zur direkten Abfrage der Vorkommen – inklusive Kontext – z.B. einer Person im Text der »Teutschen Academie«.  Für Projekte, die solche Möglichkeiten nicht nutzen möchten oder können, aber selbst Personen-Normdaten sammeln und eine einfache, automatisierte Art der Verknüpfung zu und von Sandrart.net anstreben, wird mit PND-BEACON (http://ta.sandrart.net/editionsinformationen/services/pnd-beacon/) daneben ein weiterer Mechanismus zur Vernetzung angeboten.

 

Wenn Sie Fragen zur konkreten Nachnutzung haben, Vorschläge für die Verbesserung unserer (aus den genannten Gründen sehr unvollkommenen) RDF-Daten oder wenn Sie selbst PND-BEACON-Daten publizieren und meinen, Ihr Projekt wäre in inhaltlicher Hinsicht für Sandrart.net ein lohnenswertes Verweisziel, sprechen Sie uns bitte an.

 

Carsten Blüm, Thorsten Wübbena

0 Comment(s)

Kommentar

Kontakt

Kommentar

Absenden