Navigation

Service-Menü

Hauptmenü



Bereichsmenü


Koios++

Semantische Suchmaschine

Die semantische Suchmaschine Koios++ dient der bedeutungsnahen Suche von Informationen.

Beschreibung

Illustration

Im Unterschied zum rein syntaktischen Vergleich von Zeichenketten fußt die semantische Suche auf der inhaltlichen Bedeutung einer Suchanfrage. Dies ist relevant bei der Lösung des Problems der Synonyme (Bulimie, Ess-Brechsucht) oder der Homonyme (Adler: Bekannter Psychologe, Greifvogel). Die semantische Suche ist konzeptbasiert, indem von der Maschine Wissen und Assoziationen für die Antwort herangezogen werden, ganz analog zum menschlichen Denken. Der Aufbau des heranzuziehenden (domänenspezifischen) Wissens erfolgt mittels Thesauri, semantischen Netzen und Ontologien. Formal dienen zur maschinenlesbaren Repräsentation des Wissens Datenformate, die im Zusammenhang mit dem Semantic Web entwickelt wurden: OWL (Web Ontology Language) und RDFS (Resource Description Framework Schema) dienen zur Beschreibung von Ontologien. Im Falle von RDFS können große Wissensnetze konstruiert werden, die Ähnlichkeiten zu semantischen Netzen aufweisen. Alle Aussagen in RDF(S) bestehen aus drei Elementen, die als Subjekt, Prädikat und Objekt bezeichnet werden. Die Elemente werden in dieser Reihenfolge zu einem Tripel (3-Tupel) zusammengefasst, mit dessen Hilfe einfache natürlichsprachliche Sätze repräsentiert werden können. Ein Beispiel für ein solches Tripel im bibliographischen Kontext lautet: "Person P ist Autor von Werk W". Die Zuweisung der Bedeutung erfolgt durch die Verbindung der Aussagen mit Ontologiekonzepten. Das Wissen (eine große Menge von Tripeln) wird in sogenannten Triplestores vorgehalten. Die Abfrage dieser Wissensbasis geschieht üblicherweise mit der Sprache SPARQL (SPARQL Protocol And RDF Query Language).

Wissensnetz für die Psychologie

Der Aufbau eines Wissensnetzes für die Psychologie als wichtige Grundlage zur Realisierung der semantischen Suche wurde in einem Projekt von DFKI und ZPID mit vier Arbeitspaketen in Angriff genommen.

  • (1) Entwicklung von Ontologien: Analyse des Klassifikationsschemas und der bibliographischen Daten von PSYNDEX, PsychAuthors und ERIC. Umwandlung in SKOS (Simple Knowledge Organization System) bzw. BIBO (Bibliographic Ontology). Ablage in einem Subversion-Repositorium.
  • (2) Implementierung eines ZPID-SPARQL-Servers: Auf der Basis der Virtuoso Open Source-Edition wurde eine Server-Infrastruktur realisiert, mit der die entwickelten Ontologien und entsprechende Instanzdaten gespeichert und abgefragt werden können.
  • (3) Datenimport: Es wurden Importfunktionalitäten entwickelt, mit denen der Datenbestand aus PsychAuthors und PSYNDEX automatisch in die semantische Infrastruktur übernommen werden kann.
  • (4) Zur Komplettierung des Wissensnetzes wurden Wort-N-Gramme bestimmt, die mit den Termen des APA-Thesaurus korrespondieren, weitere Wortformen ermittelt und alternative Begriffe hinzugefügt. Das aus fachlich-konzeptioneller Sicht unvollkommene Vokabular der Nutzer kann so durch den Interpretationsprozess der Suchanfrage kompensiert werden.

Semantische Suchmaschine KOIOS++

Die semantische Suchmaschine Koios++ realisiert eine stichwortbasierte Suche auf RDF(S) Daten. Die Stichworte werden mit Hilfe der Daten auf SPARQL-Queries abgebildet, die wiederum zur eigentlichen Faktensuche verwendet werden. Der Vorteil dieses Ansatzes besteht darin, dass die Anwender kein explizites Wissen über das Schema bzw. die Sprache SPARQL benötigen. Die im Wissensnetz abgelegten RDF-Daten wurden mit Hilfe der Suchmaschine Koios++ durchsuchbar gemacht. In diesem Fall ermöglicht Koios++ eine stichwortbasierte Recherche nach Psychologieliteratur. Die Stichworte werden auf isolierte Elemente der RDF-Daten abgebildet und im Folgenden eine Verbindung zwischen diesen Elementen gesucht. Das Ergebnis des geschilderten Prozesses wird anhand eines semantischen Netzes veranschaulicht, das zugleich das Resultat der Recherche darstellt. Koios++ berechnet im Regelfall mehrere Ergebnisse zu einer Anfrage, da die Analyse der eingegebenen Stichworte mehrere Möglichkeiten der Interpretation zulässt.

Ein grundsätzliches Problem bei der Informationssuche besteht darin, dass der Anwender die Ergebnisse eines entsprechenden Systems nicht hinreichend mit seiner Eingabe in Verbindung setzen kann. Dies ist besonders dann wahrscheinlich, wenn der Anwender sein Suchproblem nicht adäquat formulieren kann (z.B. mit Stichworten). Aus diesem Grund versucht Koios++ die Suchergebnisse mittels Erklärungen in Form von semantischen Netzen anzureichern und in eine Art Dialog mit dem Benutzer zu treten, sein Suchproblem zu lösen und bei der Aneignung neuen Wissens behilflich zu sein.

Koios++ versucht Erklärungen zu Suchergebnissen an den jeweiligen Benutzer anzupassen, in dem Information entweder hinzugefügt oder ausgeblendet werden. Hierbei kommen statistische und logische Verfahren zum Einsatz, die vor allem das Wissen des Benutzers im jeweiligen Wissensgebiet berücksichtigen. Zu diesem Zweck wurde eine Formel zur Bewertung der Verständlichkeit von semantischen Netzen entwickelt. In dieser Formel werden vor allem der Bekanntheitsgrad von Begriffen (Knoten des Netzes) und die Nachvollziehbarkeit von Begriffsverknüpfungen (Kanten des Netzes) betrachtet. Letzteres wurde anhand eines Experiments im letzten Jahr untersucht; die Publikation der Ergebnisse ist in Vorbereitung.

Suche nach psychologischer Literatur

Der generische Ansatz von Koios++ lässt sich unter anderem auch zur Suche nach Literatur in der Psychologie verwenden. In diesem Fall enthalten die SPARQL-Queries genau 1 Variable, deren Instanziierung einer speziellen Dokumentklasse zugeordnet werden kann (Artikel, Tagungsbeitrag etc.). Die Instanzen bzw. konkreten Dokumente sind mit Konzepten aus dem APA-Thesaurus annotiert, die in der Regel so speziell wie möglich gehalten sind. Angenommen, ein Anwender sucht nach Dokumenten, die mit den Begrifflichkeiten "Depression" und "Psychoanalyse" zu tun haben. Für den Fall, dass ein Dokument mit den Konzepten "Bipolare Störung" und "Psychoanalyse" annotiert ist, würde Koios++ dieses Dokument vorschlagen, selbst wenn das Wort "Depression" im Textkörper nicht vorkommt. Der Vorschlag ist nur deswegen möglich, da Koios++ aufgrund seines Hintergrundwissens inferieren kann, dass das Konzept "Bipolare Störung" in engem Zusammenhang zu "Depression" steht. Auf diese Art und Weise wird prinzipiell die Treffermenge erweitert, was grundsätzlich nicht von Vorteil ist. Aus diesem Grund liefert die Dokumentsuche von Koios++ vor allem dann verwertbare Resultate, wenn die Suchanfrage mehrere Konzepte beinhaltet.

Weitere semantische Suchmaschinen

Eine semantische Suchmaschine im medizinischen Kontext ist GoPubMed, während Wolfram Alpha als rechnende Wissensmaschine reüssiert.

Publikationen

2015

  • Forcher, B. (2015). Generierung verständlicher Erklärungen für Semantic Web Applikationen. Dissertation, Technische Universität Kaiserslautern. München: Verlag Dr. Hut.

2014

  • Forcher, B., Roth-Berghofer, T., Agne, S., & Dengel, A. (2014). Justifications of Medical Semantic Search Results. Intuitive Engineering Applications of Artificial Intelligence, 30, 1-17.
    doi:10.1016/j.engappai.2014.01.013

Tagungsbeiträge

2014

  • Forcher, B., Giloj, A., & Weichselgartner, E. (2014, Oktober).
    Keyword-Based Semantic Search Engine Koios++. 13th International Semantic Web Conference, Riva del Garda - Trentino, Italien.

URLs der Links auf dieser Seite



weiterführende Informationen

Weitere Informationen

PD Dr. Erich Weichselgartner
Telefon: +49 (0)651 201-2056
Leibniz-Zentrum für Psychologische Information und Dokumentation (ZPID)
Universitätsring 15,
54296 Trier

Interessiert an einer Demonstration von Koios++? Dann kontaktieren Sie doch bitte PD Dr. Erich Weichselgartner.

Folgen Sie uns auf Twitter

Kontakt und Funktionen

URL der Seite: https://www.zpid.de/index.php?wahl=forschung&uwahl=informationstechnologie&uuwahl=Koios