SLUBsemantics - Multilinguale semantische Suche
Seit Beginn des Jahres 2011 entwickeln die SLUB Dresden und die junge Firma Avantgarde Labs eine multilinguale semantische Katalogsuche — SLUBsemantics.
Die multilinguale semantische Katalogsuche wird in Eigenleistung der SLUB kontinuierlich weiterentwickelt.
SLUBsemantics befindet sich derzeit in der Betaphase 2. In dieser Ausbaustufe ist SLUBsemantics voll in die normalen Suchfunktionen des SLUB-Kataloges integriert und macht zusammen mit den gewohnten formalen und inhaltlichen Drilldown-Facetten mehrere Millionen lokale Titeldaten der SLUB zugänglich. Die eingegebenen Suchbegriffe werden zur Laufzeit auf semantische Konzepte zurückgeführt, in ihren jeweiligen Wissenskontext eingeordnet und mit automatisch angereicherten Indexterme der Katalogisate gematcht. Auf diese Weise können Suchanfragen, die in verschiedenen Sprachen gestellt werden, mit relevanten Titeln aus unserem Katalog bedient werden - unabhängig von der Sprache, in der diese Titel verfasst bzw. beschrieben sind.
Die magisch wirkende Funktionsweise von SLUBsemantics ist Resultat eines einfachen Prinzips: des Rückgriffs auf große, sozial gepflegte und netzwerkartig angelegte Informationsstrukturen zum Zweck der automatischen Anreicherung und Verknüpfung von Katalogdaten. Wir bedienen uns dabei unter anderem der freien Enzyklopädie „Wikipedia“, des größten Lexikons der Welt. Die Software erkennt vollautomatisch den inhaltlichen Zusammenhang der Suchanfrage und gibt strukturierte Trefferlisten aus. Gibt der Benutzer zum Beispiel das Wort „Bank“ ein, werden ihm sowohl relevante Katalogeinträge zu (einzelnen) Kreditinstituten, der Bankenkrise oder dem Eurosystem als auch zum Sitzmöbel oder einer Sandbank vorgeschlagen. Sucht er „Hauptstadt Belgien“, werden auch alle Treffer mit „Brüssel“ berücksichtigt. Lautet die Eingabe „Gone with the wind“, erhält er zugleich Treffer zum deutschen Filmtitel „Vom Winde verweht“, zum Regisseur Victor Fleming, zu Max Steiner, dem Komponisten der Filmmusik, und zu Margaret Mitchell, der Autorin der Romanvorlage.
Die seit Dezember 2010 bekannte Indexsuche des SLUB-Katalogs mit Rechtschreibkorrektur, Wortformennormalisierung, vielfältigen Drill-down-Möglichkeiten und einstellbaren Sortierkriterien war ein Fortschritt zur altbekannten Feldsuche, konnte aber letztlich nur ausgeben, was über ein Matching der Suchanfrage mit den beschreibenden Informationen in den Titeldaten herausgefiltert wurde. Titel, die mit anderssprachigen Deskriptoren beschrieben sind oder deren Deskriptoren Synonyme der Suchbegriffe darstellen, konnten oft nicht gefunden werden. Sonstige semantische Relationen zwischen den Deskriptoren fehlten überwiegend ganz. SLUBsemantics erfasst dagegen die Bedeutung aller lokalen Katalogdaten und ermöglicht die Eingabe der Suchbegriffe in drei Sprachen: Deutsch, Englisch und Polnisch. Semantische Beziehungen zwischen den Themen werden als Verzweigungsstrukturen dargestellt. Auf die aus der ersten Ausbaustufe bekannte grafischen Visualisierung wurde zugunsten der vollen Integration von SLUBsemantics in die normalen Suchfunktionen unseres Kataloges vorerst verzichtet. Wir arbeiten jedoch an einem den Kriterien der guten Usability entsprechenden Konzept, mit dem die grafische Sicht von SLUBsemantics wieder eingeführt wird.
Im Interesse höherer Transparenz des Suchergebnisses werden in der Detailanzeige von lokalen Katalogisaten die automatisch erzeugten Anreicherungsterme angezeigt und mit Links zu den entsprechenden Wikipedia-Artikeln versehen. Mittelfristig ist vorgesehen, Nutzer unseres Kataloges in die Korrektur und Erweiterung unserer automatisch erzeugten Anreicherungsdaten einzubeziehen.
Bitte helfen Sie uns, SLUBsemantics laufend zu verbessern und weiter zu entwickeln. Für Ihre Hinweise sind wir dankbar.