 |
Abgeschlossene Diplomarbeit: Relevanzuntersuchung für Retrieval von strukturierten Dokumenten
|
 |
Betreuer
Bearbeiter
Abgabetermin
1998-12
Aufgabenstellung
Klassisches Information Retrieval betrachtet Dokumente als Sammlung von
Termen. Dokumente besitzen jedoch meist eine logische Struktur. Man
versucht daher, diese zusätzliche Information für das Retrieval zu nutzen.
Versuche sollen zeigen, ob sich die Retrievalqualität durch
Berücksichtigung der Dokumentstruktur verbessern läßt. Dabei stellt sich
insbesondere die Frage, ob es in Dokumenten Teile gibt, deren
Informationsgehalt höher zu bewerten ist. Bei praktischen Untersuchungen
ergibt sich das Problem, daß es schwierig ist, eine Kollektion
strukturierter Dokumente zu bekommen, für die es Relevanzurteile sowohl zu
den Teilen, als auch zu dem Gesamtdokument gibt.
Wenn man sich eine Kollektion von einfachen unstrukturierten Dokumenten
mit dazugehörigen Relevanzurteilen nimmt, könnte man sich hieraus eine
Kollektion strukturierter Dokumente zusammenstellen, für deren
Elementardokumente Relevanzurteile vorliegen. Zu klären ist dann die
Frage, ob sich aus den Relevanzurteilen der gegebenen Kollektion,
Relevanzurteile zu den kombinierten Dokumenten generieren lassen.
Aufgabe ist es, verschiedene Möglichkeiten der Relevanzvergabe
auszuprobieren und sie auf ihre Anwendbarkeit zu untersuchen.
|