Metadaten und Heterogenitätsbehandlung als wesentliche Elemente zur
Entwicklung eines europäischen Schulportals. Das Projekt European
Schools Treasury Browser - ETB
Michael Kluck
IZ Sozialwissenschaften Bonn und Humboldt-Universität Berlin
kluck@bonn.iz-soz.de
Einführung
Im Rahmen des Europäischen Schulnetzes (European Schoolnet - EUN) ist
die Schaffung eines europäischen Netzwerkes der nationalen und
regionalen Schulnetzwerke vorgesehen. Die technischen und inhaltlichen
Voraussetzungen sollen durch das Forschungsprojekt ETB geschaffen
werden. Aufbauend auf einem Vorläuferprojekt, das einige
Startbedingungen vorbereitet hat, sollen nun die technische
Netzinfrastruktur und die inhaltliche Integration der verschiedenen
Angebote und ihrer kulturellen und sprachlichen Kontexte realisiert
werden.
Hier sollen nur die Fragen der inhaltlichen Integration der Bestände des
Netzwerkes bzw. der beteiligten nationalen und regionale Netzwerke und
des Angebotes für die anvisierten Nutzer behandelt werden. Zentrale
Benutzergruppen werden Lehrer und Schüler sein, hinzu kommen weitere
Akteure im Umfeld der Schule (Schulleiter, Eltern, Wissenschaftler,
Planer, Politiker).
Rahmenbedingungen für vergleichbare Metadaten in den europäischen Schulnetzen
Um die Angebote der vorhandenen Sammlungen (Repositories) von
Internetquellen zu Schule und Unterricht in einem gemeinsamen Angebot
darstellen zu können, müssen die Inhaltsbeschreibungen der verschiedenen
Sammlungen in eine vergleichbare Form gebracht werden. Dies erfolgt mit
zwei Strategien:
1. Festlegung eines Mindeststandards für die Inhaltsbeschreibung
2. Behandlung der vorhandenen Sammlungen mit einem Abbildungsverfahren auf
den definierten Standard bzw. mit Verfahren der Metadatenextraktion
Zunächst wird die Entwicklung des Mindeststandards, der sich an Dublin
Core (Weibel/Koch 2000) orientiert, erläutert. Dieser Mindeststandard
soll nach Möglichkeit von den vorhandenen Sammlungen auf die neuen
Internetquellen angewendet, in ein Komplettset eines Repository-Tools
integriert, das den Entwicklern neuer Repositories angeboten wird, und
in einem Template für individuelle Anmeldungen von Internetquellen
verwendet werden.
Metadatenextraktion und -abbildung zur Verbesserung der Datenqualität
und Suchmöglichkeiten
Die zweite Strategie der Extraktion bzw. Abbildung von Metadaten auf
einen einheitlichen Standard soll die Qualität der Inhaltsbeschreibung
der Internetquellen (sowohl auf der Ebene des europäischen Portals als
auch für die beteiligten Sammlungen auf nationaler und regionaler ebene)
verbessern und somit eine gezieltere Suche ermöglichen.
ETB-Thesaurus als zentrales Beschreibungsmittel des Informationsgehaltes
Um die Beschreibung der Inhalte stärker zu fokussieren und die Basis für
einen mehrsprachigen Zugriff auf die Informationen zu legen, wird ein
mehrsprachiger Thesaurus von schulrelevanten Deskriptoren entwickelt,
der zunächst in den fünf Hauptsprachen der EU, später in weiteren
Sprachen vorliegen wird. Die Basis für die Auswahl der Deskriptoren
bilden vorhandene multilinguale Thesauri im Bildungsbereich und
empirische Analysen von Logfiles und bereits verwendeten Deskriptoren
ausgewählter Bildungsserver (wie z.B. des Deutschen Bildungsservers).
Heterogenitätsbehandlung zur Nutzung vorhandener Inhaltsbeschreibungen
Das Schalenmodell zur Behandlung unterschiedlicher Qualitätsniveaus der
Inhaltsbeschreibung von Datenbeständen (Krause 1996) bildet die
Grundlage für die Nutzung verschiedener Strategien der Reduzierung von
Heterogenität. Sowohl die intellektuelle Erstellung von
Kreuzkonkordanzen als auch die statistische Auswertung von Relationen
zwischen signifikant bedeutungstragenden Begriffen werden hier im
Kontext von Bildung bzw. Schule verwendet. Hierbei wird auf
Projekterfahrungen und Forschungsergebnisse in anderen Zusammenhängen
(Virtuelle Bibliothek Sozialwissenschaften, CARMEN, ELVIRA)
zurückgegriffen und auf andere Projekte zur automatischen Indexierung
Bezug genommen.
Multilingualer Zugang durch Nutzung von Thesaurus und Heterogenitätskomponenten
Die Komponenten zur Behandlung der Heterogenität können auch für die
Bearbeitung der Probleme der Multilingualität genutzt werden, da
prinzipiell kein Unterschied zwischen der Relationierung zweier Thesauri
in naheliegenden Fachgebieten oder in verschiedenen Sprachen besteht.
Zusammenfassung
Das Projekt ETB befindet sich am Beginn des zweiten Jahres seiner
Laufzeit und stellt einen weiteren Anwendungsfall der
Heterogenitätsbehandlung und Metadatenextraktion dar, die bereits in
anderen Projekten erfolgversprechende Resultate gezeigt haben.
Das Projekt hat seine Homepage unter http://etb.eun.org. Dort können erste Ergebnisse und generelle Informationen eingesehen werden. Unter
http://www.eun.org kann das Europäische Schulnetz mit seinen allgemeinen Informationen und den weiteren spezifischen Projekten eingesehen werden.
Literaturnachweise
Ardö/Koch 1999: Anders Ardö, Traugott Koch: Automatic classification
applied to the full-text Internet documents in a robot-generated subject
index. In: Online Information 99. Proceedings. 23rd International
Online Information Meeting. London, 7-9 Dec 1999, p.239-246.
Manuscript at: http://www.lub.lu.se/~traugott/online99.htm
Kluck et al. 2000: Michael Kluck, Jürgen Krause, Matthias Müller, in
Kooperation mit Rudi Schmiede u.a. Virtuelle Fachbibliothek
Sozialwissenschaften. Bonn: 2000 (= IZ-Arbeitsbericht, Nr. 19); at
http://www.bonn.iz-soz.de/publications/series/working-papers/#Virtuell
pdf-file for downloading.
Koch/Vizine-Goetz 1999: Traugott Koch, Diane Vizine-Goetz: Automatic
Classification and Content Navigation Support for Web Services. DESIRE
II co-operates with OCLC. In: Annual Review of OCLC Research 1998
http://www.oclc.org/oclc/research/publications/review98/koch_vizine-goetz/automatic.htm
Koch 1998: Traugott Koch: Nutzung von Klassifikationssystemen zur
verbesserten Beschreibung, Organisation und Suche von
Internet-Ressourcen. Buch und Bibliothek 50:5, p.326-335. Manuscript
with hyperlinks at:
http://www.ub2.lu.se/tk/publ/bubmanus.html
Meier 2000: Wolfgang Meier, Matthias N.O. Müller, Stefan Winkler:
Virtuelle Bibliothek Sozialwissenschaften. Problembereich und
Konzeption. In: Bibliotheksdienst, Vol. 34, No. 7/8, 2000, p.
1236-1244
http://www.dbi-berlin.de/dbi_pub/bd_art/bd_2000/00_07_12.htm
Krause 1999: Jürgen Krause: Sacherschließung in virtuellen Bibliotheken.
Standardisierung versus Heterogenität. In: Grenzenlos in die Zukunft.
89. Deutscher Bibliothekarthag in Freiburg im Breisgau 1999. Frankfurt
am Main: 2000 (ZfBB-Sonderheft 77)
Krause 1996: Jürgen Krause: Informationserschließung und -bereitstellung
zwischen Deregulation, Kommerzialisierung und weltweiter Vernetzung
[Schalenmodell]. Bonn: 1996 (= IZ-Arbeitsbericht, Nr. 6); at
http://www.bonn.iz-soz.de/publications/series/working-papers/#Informationserschließung
pdf file for downlaoding.
Krause/Marx 2000: Jürgen Krause, Jutta Marx: Vocabulary Switching and
Automatic Metadata Extraction or How to Get Useful Information from a
Digital Library. In: First DELOS Workshop on Information Seeking
Searching and Querying in Digital Libraries, Zürich, Switzerland,
11.-12.12.2000 (forthcoming in the proceedings)
Krause 2000: Jürgen Krause: Information Systems for Social Science
Research. A Perspective from Information Science. In: Symposium
Information system for social sciences, 1.-2.10.2000, Mannheim
(forthcoming in the proceedings)
Weibel/Koch 2000: The Dublin Core Metadata Initiative. Mission, Current
Activities, and Future Directions. In: D-Lib Magazine 6 (12) 2000 at:
http://www.dlib.org/dlib/december00/weibel/12weibel.html
|