blog.arthistoricum.net
Google Books
Im Zusammenhang mit - wirklichen oder vermeintlichen - Urheberrechtsverletzungen des Google Books Project ist vor einiger Zeit viel über die kalifornische Firma berichtet und geschimpft worden. Zuletzt ist an der Front ein wenig Ruhe eingekehrt, weil mit dem Street View Project eine neue Sau durchs Dorf getrieben wird. Aber wer hat denn ganz praktisch schon mal mit google books gearbeitet? Ich bin gerade dabei und muss sagen: Sagenhaft! Mich interessiert die Diskursgeschichte der frühen Lithographie als einer "art social". Für solche Fragestellungen ist google books geradezu perfekt. Ich habe die Suche auf die Zeit von 1800 bis 1850 und auf die Sprache "französisch" eingeschränkt. Es kommen immer noch sage und schreibe 40.000 Ergebnisse auf der Basis einer Volltextanalyse eines Großteils der historischen Publizistik heraus. (Ist das die Anzahl der Bücher oder der hits zum Begriff "Lithographie?) Da bei diesem Zeitraum nun wirklich keine Urheberrechtsverletzungen mehr zu erwarten sind, werden praktisch alle Bücher (auch Zeitschriften etc.) komplett angezeigt, können als PDF exportiert werden, exzerpiert und ich weiß nicht, was noch alles. Sicher, die Transkription ist nicht perfekt (Optical Character Recognition nach Frakturschrift und altem bedruckten Papier ist eben immer noch schwierig), aber als Referenz ist es Gold wert - mal abgesehen davon, dass der Text als Bild ja auch geliefert wird. Das einzige Problem: Wie kann ich 40.000 Dokumente durchkämmen? Oder auch nur 40.000 Erwähnungen des Begriffs "Lithographie"?
- Permalink
- Ansichten: 5253
- Tags: google-books
- digitale kunstgeschichte, Graphik, Publizistik, Sonstiges
11 Kommentar(e)
Die in den Artikel genannten Fehler sind richtig beschrieben, betreffen aber alle Projekte, die nach dem (richtigen) Prinzip: "quick and dirty" agieren. Allerdings glaube ich nicht, dass google books dadurch zum wissenschaftlichen Arbeiten denkbar ungeeignet wird. Sicher, ich bekomme viele falsche Zuordnungen, und vieles finde ich eben aus dem gleichen Grund nicht. Aber nur 70% des Möglichen zu finden, ist eben besser, als gar nichts zu finden, weil es schlicht nicht vorhanden ist.
Zum wissenschaftlichen Arbeiten ist google books denkbar ungeeignet:
http://www.salon.com/books/laura_miller/2010/09/09/google_books
Lieber Herr Schümmer, verzeihen Sie meine späte Antwort (ich war im Urlaub, und zwar offline!) - umso mehr freut mich die Antwort. Werde es bei nächster Gelegenheit versuchen!
Danke!
Wie mir Klaus Graf schreibt (ich kenne niemanden, der sich in dem Feld besser auskennt und empfehle erneut wärmstens seinen blog http://archiv.twoday.net), ist die hohe Zahl, die google an hits anführt, dann aber nicht anzeigt, reine Phantasie. Das ist zwar einerseits beruhigend, da ich jetzt nicht 40.000 Treffer durchgehen muss, andererseits aber natürlich auch wieder eine Enttäuschung, weil sich dann nicht mehr so viel finden lässt. Aber so what. Was kann google dafür, dass die Leute im frühen 19. Jahrhundert nicht mehr über die Liethographie geschrieben haben?
Vielen Dank an Schümmer und Graf. Das funktioniert hervorragend!
Was mir allerdings grundsätzlich auffällt: google books search gibt mir manchmal eine viel größere Anzahl an hits als dann nachher auch tatsächlich dargestellt werden. Ist das anderen auch schon mal aufgefallen?
@Bleistifterin: oft sind die gewünschten Texte, wenn sie zwischen 1869 und ca. 1909 erschienen sind, aus urheberrechtlichen Gründen nur von Rechnern, deren Standort Google in Deutschland bzw. Europa ausmacht, nicht einsehbar, von us-amerikanischen aber sehr wohl. In diesen Fällen kann man versuchen, einen US-Proxyserver zwischenzuschalten, was am einfachsten durch die Nutzung eines Web-Anonymizer geht. Wie das funktioniert, hat Klaus Graf auf Archivalia beschrieben.
Weitere nützliche Hinweise zur Nutzung von Google Book Search findet man im einschlägigen Wikisource-Artikel.
Google-Books - super Sache! Man findet in kürzester Zeit Literatur, an die man nie gedacht hätte, und was das beste ist, kann sehen ob sie wirklich relevant ist, BEVOR man ein kleines Vermögen in Fernleihen investiert hat. Will man zitieren, zitiert man das Buch - ist ja angegeben.
In letzter Zeit sind alle für mich interessanten Texte aber leider so gesperrt, dass ich damit nicht mehr arbeiten kann. Schade eigentlich. Open Access wäre schon sehr fein, doch meine Befürchtung ist, Google will uns erst anfixen, dann Geld verlangen.
Ich nutze Google Books und habe dort auch wiederholt Puzzleteile gefunden, an die ich nicht gedacht hätte.
Mit dem OCR-Problem lernt man umzugehen (bei der Suche auch Varianten - f/s - für langes s/rundes s hilft - nicht nur bei Vorlagen in gebrochenen Schriften) - schwieriger sind die wirklich grausamen Metadaten...
40.000 Treffer kann niemand anschauen. Die Kunst ist es, nach der Durchsicht einiger Treffer die Suche in vielfältiger Form so abzuwandeln, dass man die Treffer auch findet, die zum eigenen Interesse am besten passen. Insgesamt ist Google Books (in Verbindung mit anderen Digitalisierungsprojekten, nicht zu vergessen z. B. das Internet Archive) eine unerschöpfliche Quelle. Ich habe z. B. in den letzten Jahren Wikisource-Themenseiten zu so verschiedenen Dingen wie Dienstboten http://de.wikisource.org/wiki/Dienstboten oder Oberammergau http://de.wikisource.org/wiki/Oberammergau zusammengestellt und war ob der Menge der durchaus sinnvollen Treffer immer sehr erstaunt.
Ich nutze Google books seit einiger Zeit und habe ähnlich positive Erfahrungen wie Hubertus Kohle gemacht. Zum Senator von Rom Abbondio Rezzonico fand ich so Reiseinformationen aus der Gazzetta Universale 1775, die ich sonst nie gefunden hätte und die ein interessantes Puzzleteil zum grossen Bild sind. Im Literaturverzeichnis taucht aber Google Books nicht auf und so ist die Benutzung nicht erkennbar.
Allerdings erntet Google books auch Lorbeeren, die es nicht allein gepflanzt hat. Das Digitalisierungsprojekt mit der Bayerischen Staatsbibliothek wird dort nur ungenügend vermarktet. Ich kann zwar im BSB OPAC erkennen, daß ein Titel digitalisiert vorliegt und in ihm suchen. Man kann aber m.W. keine allgemeine Suche über alle Digitalisate starten (oder doch?).
Zuletzt zur Aussage, daß Google books keiner nutzen würde. Vermutlich ist es wie mit allen anderen wissenschaftlichen Arbeitsmitteln. Der durchschnittliche Forscher hat ein Zeitfenster in dem er agil und neugierig ist und sich um Hilfsmittel kümmert. Da werden die allermeisten auf Google Books, JSTOR, Citavi usw. stossen. Und wenn er einen Job hat, tendiert er dazu, sich auf den Lorbeeren auszuruhen und mit den einmal gelernten Arbeitsmitteln zu seinen einmal gefundenen Spezialthemen weiter zu arbeiten. Oder nicht?
Siehe http://archiv.twoday.net/stories/8353330/