Montag, 19. November 2012

Swissbib sucht mit SOLR

Am Montag 19.11.11 wurden alle Suchservices von swissbib von FAST auf SOLR umgestellt. Damit ist ein grosser Schritt hin zu einem offenen Suchsystem getan und sind dem zukünftigen Ausbau des swissbib-Indexes keine lizenztechnischen Schwellen mehr gesetzt.

Obwohl an der Oberfläche wenig von dieser Umstellung zu spüren ist, ändert sich für die NutzerInnen doch das eine oder andere. Gleich bleibt sich der Umfang der Indexierung, das heisst neben den bibliographischen Daten der Bibliotheken, ausgewählter Archive und Repositories werden auch die Inhaltsverzeichnisse mit in die Suche einbezogen. Angepasst wurden vor allem die Regeln zur Sortierung, die Bildung der Facetten und die Suche in unterschiedlichen Schriftsystemen. Daneben wurden Suchmaschinenfeatures stark überarbeitet und neue Suchfelder definiert.

Folgende Bereiche sind dabei gesondert hervorzuheben:

Die Regeln der Relevanzsortierung variieren stark. Es werden vor allem bei Eintermsuchen Zeitschriften und Schriftenreihen bevorzugt. Insgesamt werden Titel nicht mehr so stark gewichtet, dafür aber die Autoren und die Beschlagwortung etwas mehr betont. Die Inhaltsverzeichnisse werden wie bislang tief bewertet, was die Menge an "false positives" gering halten soll.

Ausserdem wurden die Module für Suchvorschläge und Did-you-mean signifikant verbessert. Vor allem letzteres war während der letzten zwei Jahre aus Qualitätsgründen deaktiviert. Beide bestehen aus Termen der Titel- und Autorenfelder, was gezielte Vorschläge ermöglicht im Gegensatz zu generischen Wörterbüchern.

Bei Zeitschriften werden sämtliche Erscheinungsjahre miteinbezogen anstatt nur auf Erscheinungsbeginn und -ende fixiert zu sein. Das heisst, dass Nature (erstmals 1876 erschienen) auch in denjenigen Jahren als Treffer aufscheint, während denen die Zeitschrift erschienen ist, also z.B. 1932. Der Vorteil für die NutzerInnen liegt darin, dass zum vornherein nicht bekannt sein muss, wann eine Zeitschrift erstmals erschienen ist. Der Effekt auf der Oberfläche - in der Jahresfacette erscheinen sehr viel mehr Treffer als bisher. Die Sortierung nach Erscheinungsjahr ist von diesem Mechanismus natürlich ausgenommen.

Weiter wurden die Facetten gestrafft. So sind die bisher in fünf Kategorien gehaltenen Themen neu auf zwei zusammengefasst: Themen und Form. Die Facette "Themen" enthält die Kategorien "Sache", "Person", "Titel" und "Geografika". Die Facette "Form" enthält mehrsprachig aufbereitete Formschlagwörter, wobei nicht jeder denkbare Term übersetzt wurde sondern nur die am häufigsten verwendeten.
Ausserdem wurden die Regeln für die Autorenfacette überarbeitet, so dass neu Namen von Königen, Päpsten, Heiligen usw. besser erkennbar sind - die Schattenseite der genaueren Bezeichnungen sind Mehrfachnennungen derselben Person wegen unterschiedlicher Erfassungsweisen.

Ein Schwachpunkt der bisherigen Suche im Bereich Vernacular Script wurde beseitigt. Neu kann swissbib besser Aufnahmen mit Zeichen aus semitischen Sprachen oder chinesischen, japanischen und koreanischen Schriftzeichen umgehen. Daneben sollte auch die Suche nach Griechisch oder Kyrillisch besser geworden sein - swissbib enthält aber keine nennenswerte Zahl solcher Aufnahmen.

Neu können auch Systemnummern direkt gesucht werden - allerdings müssen sie mit dem swissbib-konformen Verbundkürzel versehen werden und mit führenden Nullstellen auf neun Stellen gebracht werden:
A-1234567 => idsbb001234567

Ausserdem müssen ISBN mit Bindestrichen  als Phrase gesucht werden, um die Anzahl der Treffer gering zu halten:

0-521-48205-4 => "0-521-48205-4" oder 0521482054



Keine Kommentare:

Kommentar veröffentlichen