Forum Archaeologiae - Zeitschrift für klassische Archäologie 71 / VI / 2014

PELAGIOS - DAS GEOGRAPHIE BASIERTE ONLINE-NETZWERK FÜR DIE ALTERTUMSWISSENSCHAFTEN

Pelagios (http://pelagios-project.blogspot.co.uk) ist ein internationales Community-Projekt mit dem Ziel Forschungsdaten aus dem Gebiet der Altertumswissenschaften online zu vernetzen. Text-, Bild- und Inschriftensammlungen, Datenbanken archäologischer Fundstücke, wissenschaftliche Fachpublikationen, digitale Personenverzeichnissen: mit seinen inzwischen mehr als 30 Partnern (http://pelagios-project.blogspot.co.uk/p/partners.html) deckt Pelagios bereits jetzt ein breites Spektrum an relevanten digitalen Inhalten über die Welt der Antike ab.
Das Verknüpfungskriterium, über das Pelagios die Verbindungen zwischen diesen vielfältigen und technisch heterogenen Daten herstellt ist die Geographie. Alle Pelagios-Partner verwenden ein gemeinsames System, um Ortsangaben in ihren Daten zu codieren. Grundlage für das System bilden sogenannte Gazetteers - Ortsverzeichnisse, die jedem Ort eine eindeutige Identifikation zuordnen. Da sich in Pelagios alles um die Antike dreht, handelt es sich naturgemäß um Gazetteers speziell für antike Orte: insbesondere (aber nicht ausschliesslich) den Pleiades Gazetteer of the Ancient World (http://pleiades.stoa.org), der vom Institute for the Study of the Ancient World der New York University betrieben wird.
Unsere Partner exportieren ihre Ortsangaben als zusätzliche Metadaten, und stellen sie (typischerweise auf ihren eigenen Projekt-oder Instituts-Webseiten) unter verschiedenen offenen Lizenzen zum download bereit. Darüber hinaus betreiben wir im Rahmen des Projekts auch ein eigenes Such-Interface, über das die Ortsreferenzen aller Partner gesammelt zugänglich gemacht sind (http://pelagios.github.io/pelagios-heatmap/, Abb. 1, 'Pelagios Heatmap': Je röter eine geographische Region, desto mehr Material ist in der Datenbank zu dieser Region verfügbar. Ein Klick auf die Karte öffnet ein Fenster mit Informationen über die dort vorhandenen Datensätze; die Textsuche ist über das Eingabefeld rechts oben möglich), und über welches dann zu den dazugehörigen Ursprungsdaten – direkt auf den jeweiligen Partner-Webseiten – navigiert werden kann.


Die Veröffentlichung der Ortsangaben als offene Daten und die dadurch entstehende Vernetzung ist sowohl für Forscher als auch für die breitere Öffentlichkeit interessant: einerseits können User damit einfach alle relevanten Daten zu einem bestimmten Ort im Pelagios-Verbund auffinden. Umgekehrt lassen sich auch problemlos alle relevanten Orte zu einem bestimmten Datensatz finden – z.B. der „geographische Fußabdruck“ einer archäologischen Sammlung oder der Ortsreferenzen in einem Textkorpus. Über die Verteilung der Ortsreferenzen lassen sich auch Datensätze mit ähnlicher geographischer Verteilung aufspüren – Daten, die mit hoher Wahrscheinlichkeit relevant füreinander sind. Darüber hinaus lassen sich auch Bezüge zwischen Orten erkunden: wenn Orte in Pelagios häufig im selben Kontext auftauchen (z.B. in der selben Forschungspublikation, im selben antiken literarischen Text, oder innerhalb der selben Museumskollektion), kann das ein Hinweis auf eine historische Verbindung sein.
Nicht minder wichtig ist dabei auch der Nutzen für die Partner selbst. Durch ihre Teilnahme an Pelagios werden ihre Daten besser auffindbar. Insbesondere für die zahlreichen kleinen, oft sehr spezialisierten, und der breiten Öffentlichkeit häufig unbekannten Altertumsprojekte stellt dies oft einen erheblichen Mehrwert dar.


Pelagios startete vor kurzem in seine 3. Förderphase, die von der Andrew W. Mellon Foundation finanziert wird. Neben der Fortführung des Community-Aspekts wird Pelagios in dieser 2-jährigen Phase (September 2013 bis August 2015) seine „Abdeckung" sowohl in geographischer als auch zeitlicher Hinsicht ausweiten. Dazu sammelt das Projektteam Ortsangaben in geographischen Texten aus der lateinischen, griechischen und arabischen Tradition, sowie aus mittelalterlichen Mappaemundi und Portolan Seekarten, und aus frühen chinesischen Texten und Landkarten. Um den Umfang der Datenaufbereitung bewältigen zu können, werden im Rahmen des Projektes auch spezielle neue Software-Werkzeuge und halbautomatische Verfahren entwickelt, die mittels Text- (bzw. Bild-) Analyse sowie durch statistische Methoden die aufwändige manuelle Annotationsarbeit reduzieren. So können zum Beispiel in englischsprachigen Übersetzugen der Texte die Ortsnamen bereits mit hoher Genauigkeit automatisch identifiziert, und plausible Gazetteer-Zuordnungen getroffen werden. Von den Experten werden diese Ergebnisse dann in einem speziellen Software-Werkzeug namens „Recogito“ (Abb. 2–3) kontrolliert und ggf. korrigiert, und bieten dann eine hilfreiche Grundlage für die Bearbeitung der Original-Sprachversionen.


Innerhalb der nächsten Projektmonate soll dieser Ansatz auch auf Landkarten ausgedehnt werden. Hier experimentiert das Projektteam mit Verfahren, die die Positionen von Schriftzügen auf der Karte automatisch vorselektieren (http://rsimon.github.io/toponym_identification/) und auf Basis ähnlicher Karten sowie anderen, von Experten bereits bestätigten, Orten selbstständig plausible Transkriptionen vorschlagen.

Weiterführende Informationen zu Pelagios finden sich auf unserem Projektblog unter http://pelagios-project.blogspot.co.uk.
Informationen zu unserem Annotationswerkzeug Recogito befinden sich insbesondere unter http://pelagios-project.blogspot.co.at/2014/01/from-bordeaux-to-jerusalem-and-back.html und http://pelagios-project.blogspot.co.uk/2014/01/theres-pliny-of-room-at-bottom-1.html, bzw. lässt sich der aktuelle Fortschritt unserer Arbeit mit Recogito auch direkt unter http://pelagios.org/recogito verfolgen.

Literatur:
http://okfn.at/2013/10/01/openglam-projekt-des-monats-pelagios/


© Rainer Simon
e-mail: Rainer.Simon@ait.ac.at

This article should be cited like this: R. Simon, Pelagios - das Geographie basierte Online-Netzwerk für die Altertumswissenschaften, Forum Archaeologiae 71/VI/2014 (http://farch.net).



HOME