Metadaten Workshop in der SUB-Göttingen, Dezember 1996

Metadaten in der Physik

Wege aus dem "Chaos", hin zu einer koordinierten Suche


Die heutigen Suchmaschinen sind meist global, wenig spezialisiert. Hieraus resultieren eine Reihe grundlegender Probleme:
  1. Viele "Treffer" sind gar keine, der Nutzer droht in der Flut der Antworten zu ertrinken.
  2. Viele Datenbankeinträge sind total veraltet, die Links funktionieren nicht mehr.
  3. Die Suchmaschine unterstützt den Nutzer nur wenig oder gar nicht bei der Formulierung von Suchanfragen, da in die Suchmaschine kein Fachwissen einfließen konnte.
Neben dem Trent, hin zu diesen globalen Suchmaschinen (a la AltaVista, HotBot, Lycos, ...) ist gleichzeitig zu beobachten, daß ebenfalls lokale Suchmaschinen wie Pilze aus dem Boden sprießen. Diese lokalen Suchmaschinen sind meist gut gepflegt und aktuell, da die komplette Datenbank wöchentlich, oft täglich neu erstellt wird. Leider sind diese lokalen Suchmaschinen häufig "selbstgestrickt" und nicht zueinander kompatibel.
Ziel der Bemühungen in der Physik ist es, diese lokalen Suchmaschinen, auf ein System umzustellen, das den Austausch der Datenbanken erlaubt. Hierzu eignet sich das SOIFormat. Als lokale Suchmaschinen versuchen wir deshalb SOIF-basierte Systeme zu verbreiten. Derzeit sind dies meist Harvest-Systeme. Eine Reihe von Fachbereichen ist bereits so verknüpft.


Modell eines europäischen Broker-Netzwerkes für Fachinformation: Die lokalen Broker werden von den WWW-Administratoren betreut und gepflegt. Für die nationalen Broker ist jeweils ein von der EPS ernannter "National Coordinator" zuständig. Der zentrale Broker kann beliebig oft gespiegelt sein, so daß diese Abbildung nur eine sehr grobe Vereinfachung des tatsächlichen Netzes darstellt.


Modell eines komplexen Broker-Netzwerkes, bestehend aus lokalen und nationalen Brokern, die teilweise spezialisiert sind (hier: Unterscheidung zwischen allgemeinen Department-Informationen und Dokumenten).


Will man das Modell wieterhin weltweit umsetzen, so wird es spätestens hier notwendig, sich Gedanken über eine Verringerung der Netzbelastung zu machen.
Dazu gehören ein geeignetes Datenprotokoll für die SOIF-Dateien und die ständige Neuberechnung der idealen Netztoplogie. Gleichzeitig ist zu betonen, daß weltweit identische (nicht nur ähnliche!) Metadatensätze verwendet werden müssen.

Was ist also zu tun? Die bereits bestehende Organisationsstruktur lokaler und nationalter Web-Koordinatoren sollte in eine entsprechende technische Struktur überführt werden. Eine Zentrale Stelle ist einzurichten, die die lokalen Administratoren bei der Installation von Harvest Gatherern und Brokern unterstützt und berät. Gleichzeitig müssen sich alle Beteiligte auf einen gemeinsamen Satz von Meta-Daten einigen.

Eine Anpassung der Metadatensätze an Dublin-Core wird in den kommenden Wochen erfolgen. Dabei werden wir von dem Satz an Metadaten ausgehen, der bereits zusammen mit der Mathematik in Osnabrück (Schwänzl, Plümer) entwickelt wurde. Hier gibt es eine HTML-Eingabeform, um den Autoren eine einfache und fehlerfreie Erstellung der Meta-Daten zu ermöglichen.

Die neu zu definierenden Metadatensätze sollten nicht nur zu Dublin-Core kompatibel, sondern auch bijektiv auf BibTeX-Files abbildbar sein. Gleichzeitig sind die Broker auf diese Metadaten zu optimieren; nur so wird es möglich sein, die Autoren zu der geringen Zusatzarbeit - der Metadatenerstellung - zu motivieren.


Thomas Severiens