Supervisor(s)

Student

Finished

2013-03

Formalia

Targeted audience
  • AI Bachelor
Preconditions
  • Java-Kenntnisse
  • Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen
  • Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
  • Vorlesungen "Information Retrieval" (wünschenswert)

Task description

Bei der offenen Suche nach Dokumenten ist ein wichtiger, und häufig wiederholter, Schritt die Beurteilung eines Dokuments hinsichtlich seiner Relevanz. Dazu dienen in erster Linie die Dokument-Zusammenfassungen, die in der Ergebnisliste angezeigt werden. Tombros und Kollegen konnten zeigen, dass Zusammenfassungen, die sich an den Termen der Suchanfrage orientieren (query-biased summaries), besser für die Relevanzbeurteilung geeignet sind, als solche, die z.B. die ersten 5 Zeilen des Dokuments anzeigen.

Um die Relevanzbeurteilung noch erfolgreicher zu machen, sollen weitere Verfahren umgesetzt und evaluiert werden. Dazu zählen die Zusammenfassungen auf Basis von Word Clouds. Verglichen werden sollen Word-Cloud-basierte Zusammenfassungen in alphabetischer Sortierung mit Word-Cloud-Zusammenfassungen in der Reihenfolge im Text und query-biased summaries als Baseline.

Die Bachelorarbeit umfasst folgende Schritte:

Literature

Anastasios Tombros; Mark Sanderson (1998).
Advantages of Query Biased Summaries in Information Retrieval.. In Proceedings of the 21st Annual International ACM SIGIR Conference on Research and Development in Information Retrieval