Supervisor(s)

Student

Related projects

DAFFODIL
Distributed Agents for User-Friendly Access of Digital Libraries

Finished

2005-03

Task description

Im Rahmen des DFG-Projektes DAFFODIL wurde ein nutzerorientiertes Zugangssystem für heterogene digitale Bibliotheken entwickelt. Aufgabe der Diplomarbeit ist, ein Konzept für die proaktive Unterstützung bei der Formulierung von Suchanfragen in DAFFODIL zu erstellen, zu evaluieren und exemplarisch zu implementieren. Der Schwerpunkt der Arbeit liegt dabei auf der Interaktion des Systems mit dem Benutzer.

Ansatz zur Unterstützung des Benutzers

Suchvorgänge in Digitalen Bibliotheken sind i.d.R. iterativ, d.h. einem Suchbedürfnis folgen mehrere Suchschritte jeweils mit einer Query, die nach Durchsicht und ggf. Bearbeitung von bisher gefundenen Dokumenten geändert oder komplett neu formuliert wird. Bei jedem dieser Vorgänge treten Phänomene auf, die Aufschluß über die Interessen des Benutzers geben und die benutzt werden können für automatische, proaktive Vorlageleistungen durch das Benutzerinterface.

Wenn es gelingt, dem Benutzer sinnvolle proaktive Funktionen anzubieten, kann das zu einer schnelleren Formulierung der Queries führen und hoffentlich auch zu einer Erhöhung der Qualität der Treffer hinsichtlich recall und precision - abhängig von Art und Auswahl der angebotenen Funktionen.

Zu lösende Probleme

Folgende Bereiche bedürfen näherer Betrachtung.

Identifikation geeigneter Funktionen

Es ist eine ganze Reihe von Funktionen vorstellbar, die im Einzelnen auf ihren Effekt hin untersucht werden müssen: Die Unterstützung kann einerseits ein Vorschlag über mögliche Suchterme bspw. zu bestimmten Themen, Autoren, etc. sein, andererseits aber auch die Anzeige von mutmaßlichen Fehlern in der Suchanfrage. Unterprobleme in diesem Bereich sind u.a. die Erstellung und Pflege eines Benutzermodells sowie die automatische Erstellung von Hierarchien von verwandten Termen.

Durch die Architektur des Systems bedingte Beschränkungen

DAFFODIL ist ein verteiltes System. Der Benutzer interagiert mit dem System über ein Frontend. Dieses Frontend kommuniziert mittels XML-Nachrichten mit einem Backend. Das Backend ist wiederum verteilt: es besteht aus einzelnen Agenten, von denen einige wiederum Digitale Bibliotheken über HTTP befragen. Der hohe Grad an Verteilung im System ergibt eine Beschränkung der Antwortzeiten nach unten. Bereits erprobte Konzepte wie inkrementelle Suche oder auch nur eine mitlaufende Angabe der Mächtigkeit der Ergebnismenge durch häufige Befragung des Backends sind daher nicht oder nicht ohne weiteres implementierbar. Erfolge sind hier nur durch Kombinationen aus Caching und probabilistischen Verfahren zu erwarten. Der Umstand, daß die Dokumente in getrennten Digitalen Bibliotheken vorliegen, machen die Anwendung von Mechanismen wie Latent Semantic Analysis unmöglich und alternative Konzepte für die Lösung der damit verbundenen Probleme (vor allem das Vokabular-Problem) nötig. Ein Ansatzpunkt dabei ist die explizite Vorlage von Synonymen und Homonymen. Solch ein Verfahren schließt das Teilproblem der (im besten Fall automatischen) Erzeugung und Wartung einer Wortdatenbank ein.

Benutzermodell

Fehler in der Eingabe zu entdecken, ist vergleichsweise einfach. Um aber Aussagen über die Qualität der Eingabe des Benutzers oder aktuell sinnvolle Hilfsangebote machen zu können, muß das System wissen, welche Interessen der Benutzer überhaupt hat, um daraus ableiten zu können, welche Dokumente er finden möchte. Daraus resultiert die Notwendigkeit eines Benutzermodells, das aber auch für andere Bereiche in Daffodil interessant ist.

Design und Timing der Intervention des Systems

Die Hinweise an den Benutzer müssen den Benutzer bei seiner Arbeit unterstützen, ohne ihn über Gebühr abzulenken. Die Herausforderung besteht daher darin, die Interaktion des Systems in puncto Timing und Gestaltung möglichst natürlich in das Suchinterface zu integrieren. Um dies zu gewährleisten werden Usability-Studien in mehreren Phasen des Projekts durchzuführen sein.

Result text

Matthias Jordan (2005).
DAFFODIL: Proaktive Vorlagefunktionen. Diplomarbeit

Literature

J. Krause (1997).
Graphische Oberflächen für das Textretrieval im Rahmen des WOB-Modells. Skriptum , Universität Koblenz, Institut für Informatik
N. Fuhr; N. Gövert; C.-P. Klas (2000).
An Agent-Based Architecture for Supporting High-Level Search Activities in Federated Digital Libraries. In: Proceedings 3rd International Conference of Asian Digital Library. KAIST, Taejon, Korea.
Claus-Peter Klas; Norbert Gövert; Norbert Fuhr (1999).
Distributed agents for user-friendly access of Digital Libraries. In: Searching for information: artificial intelligence and information retrieval approachesNumber 17. IEE Informatics, Savoy Place, London WC2R 0BL, UK.
Norbert Gövert; Norbert Fuhr (1999).
Ein Agentensystem für digitale Bibliotheken im WWW. In: Proceedings ADI'99 (Agenten -- Datenbanken -- Information Retrieval)