Elektronische Informationen für die Physik

Eberhard R. Hilf

Glossar

Einige Begriffserläuterungen aus dem Blickwinkel meiner praktischen Anwendung, nicht der Computer-Experten.

Copyright: genauer: Urheberrecht. Die widerstreitenden Interessen der Beteiligten haben bisher nicht zu einem weltweiten einheitlichen juristischen Regelwerk geführt. Wohl aber wird der Nutzer von Information die berechtigten Interessen der Beteiligten zu wahren versuchen: Als Autor dieses Artikels möchte ich, daß dieser Artikel weltweit in möglichst vielen Kopien existiert und gelesen wird, aber auf keinen Fall geändert wird, der Verlag, vermute ich, möchte, daß der Nutzer auf das schön gedruckte Heft Phys. Bl., April 1997, korrekt hinweist und so den Verkauf zukünftiger Ausgaben fördert.

Dublin Core : Der Versuch, die verwendeten Metadaten für die verschiedensten Dokumenttypen international formatunabhängig zu standardisieren. Der Dokumentbegriff ist hier sehr weit gefaßt: Vom elektronischen File bis zur antiken Statue in einem Museum. Der Elementarsatz besteht aus 15 Elementen.

e-Print Server : Suchmaschine und Datenbank, an die elektronische Dokumente wissenschaftlichen Inhalts gesendet werden können. Sie werden archiviert, such- und lesbar gespeichert.

Gatherer: (siehe Indizierer)

HARVEST: Suchmaschinen-Programm Paket, das ohne "Zentrum" auskommt. Broker an verschiedenen Orten holen sich von Gatherern an anderen Orten Indexlisten und tauschen untereinander Anfragen aus. Harvest gilt als besonders geeignet für das Suchen von Informationen aus sehr vielen Orten, z. B. weltweit allen Physikfachbereichen und Instituten. Die Software ist frei zugänglich, daher ist das Entwicklungstempo sehr hoch, weil sehr viele Wissenschaftler (in ihrer Freizeit) dazu beitragen können.

Indizierer: numerisches Programm, das Texte durchsucht und eine Liste aller gefundenen Worte anlegt zusammen mit dem Namen des Dokumentes, in dem das Wort gefunden wurde. Da in einem Dokument i. a. viele Worte mehrfach auftauchen, ist die zugehörige Indexliste sehr viel kürzer als der Artikel selbst.

Metadaten: Informationen in einem Dokument, die das Dokument beschreiben und so bibliographischen Informationssystemen zugänglich machen: "dies ist eine Adresse", " dies ist ein Name". Ohne diese Zusatzinformation in Dokumenten und deren Verarbeitung durch die Suchmaschinen ist z.B. für mich die Suche in Suchmaschinen nach meinen Verwandten gleichen Nachnamens sehr frustrierend.

SGML (Structured General Markup Language): der Versuch, eine einheitliche international respektierte "Sprache" zu vereinbaren. Es werden Dokumentteilen Informationen (Metadaten) angeheftet, die dem Nutzer (und Computer-Verarbeitungsprogrammen wie zum Beispiel Druckprogrammen) mitteilen, welche Eigenschaften dieses Dokumentteil hat. Als (fiktive) Beipiele möge gelten: "dieser Dokumententeil ist ein Eintrag in einem Glossar", in SGML wäre dies vielleicht <glossar><glossar-entry> dieser Absatz </glossar-entry> ... </glossar>. In der Physik verwenden intern alle großen Verlage SGML - in leicht unterschiedlichen "Dialekten". Die APS und andere große amerikanische Verlage sowie die EPS haben sich sogar auf die gemeinsame Norm ISO 12083 geeinigt. Derzeit werden von verschiedenen Herstellern Hilfsprogramme erarbeitet, die den Autoren das Übertragen ihrer Dokumente in SGML erleichtern sollen. SGML ist als Archivierungssprache gedacht, ihre Sprach regeln sollen also (wie das lateinische Alphabet) auf Jahrhunderte nicht geändert werden (Im Gegensatz zur dynamischen Entwicklung der Layout- und Druckprogramme).

SOIF (Standard Object Interchange Format): Datenformat, das es erlaubt, Indexdateien zwischen verschiedenen Programmen standardisiert auszutauschen. Das SOIF-Format ist als reines ASCII-Format leicht den jeweiligen Anforderungen anpaßbar.

Suchmaschine: numerisches Programm, das die Frage eines Informations-Suchenden, die er über seinen Rechner eingegeben hat, zu beantworten versucht mittels Durchsuchen der von ihr vorgehaltenen Indexlisten über Dokumente aus Datenbanken.

URL (Unified Resource Locator): nach internationalen Regeln gewählte Bezeichnung des Dokumentes, unter der es im Internet gefunden werden kann. Dieser Artikel findet sich unter http://www.physik.uni-oldenburg.de/documents/UOL-THEO3-97-2/phbl/phbl.html. Es wäre zu wünschen, daß Ihnen als Leser der Artikel gefällt und Sie ihn sich auf Ihren Rechner kopieren. Dort müssen Sie der Datei natürlich einen Namen geben. Ein Mitarbeiter von mir könnte es z. B. http://www.physik.uni-oldenburg.de/severien/hilfserguesse.html nennen. Natürlich wird er die Zugriffsrechte so setzen, wie es Copyright-Regeln vorschreiben.

URN: absolute Adresse eines Dokumentes, welche auf seinen Erzeugungsort so hinweisen sollte, daß dort (z. B. durch den Autor) ein Originalitätsvergleich mit einer irgendwo auf dem Internet gefundenen Kopie möglich ist. Die URN eines Artikels sollte dem Artikel unverrückbar angeheftet werden. Dieser Artikel hat die von mir gewählte URN physik.uni-oldenburg.de/theo3/hilf/Phys.Bl.97-4/el-inf.tex.

WWW-Server: (World Wide Web) Anlaufpunkt im internationalen Informationsnetz. Computerprogramm, daß Ihnen erlaubt, elektronische Dokumente jedem Anderen über das Netz zur Einsicht anzubieten. Seit 1993 haben alle Physik-Fachbereiche und Institute WWW-Server eingerichtet.


E.R.Hilf, hilf@merlin.physik.uni-oldenburg.de
Endzustand dieses Teil-Dokumentes: 15.4.1997
Urheberrechtsbemerkung