Supervisor(s)

Student

Formalia

Targeted audience
  • AI Bachelor
Preconditions
  • Kenntnisse von Information Retrieval notwendig (ISM)
  • Java-Kenntnisse notwendig

Task description

Moderne Websuchmaschinen protokollieren die Anfragen, Ergebnislisten und alle durch die Benutzer ausgeführten Aktionen aus unterschiedlichen kommerziellen oder wissenschaftlichen Interessen in Logdateien.

Im produktiven Betrieb führen allerdings unterschiedlichste Ziele und Informationsbedürfnisse zur Verwendung von Suchmaschinen, welche dem Betreiber nicht bekannt sind. Ferner liegen oft keine weiteren Informationen über die einzelnen Benutzer vor, z.B. über deren technisches Verständnis oder Vorwissen bezüglich des Suchbegriffs.

Die Interpretation der Logdateien ist daher mit großen Unsicherheiten verbunden und eventuell vorhandene Muster lassen sich in der Gesamtheit der Daten nur schwer auffinden.

Aus wissenschaftlichen Sicht sind allerdings genau diese Muster von großer Bedeutung, z.B. um dem Benutzer an den richtigen Stellen im Suchprozess gezielt Unterstützung anbieten zu können. Dazu ist eine tiefgreifende Analyse der Such-Sessions nötig, zu dem im Rahmen dieser Arbeit ein Beitrag geleistet werden soll.

Konkret sind durch Betrachtung der Eigenschaften der Such-Sessions zur Klassifizierung geeignete Merkmale zu extrahieren und Teilungskriterien zu definieren. Durchgeführt werden die Arbeiten für einen 6 Monate umfassenden Auszug aus einer Logdatei einer Spezialsuchmaschine welche am Lehrstuhl vorliegt. Das Verfahren sollte aber generisch sein und auch für andere Datensätze zur Anwendung kommen können.

Diese Abschlussarbeit umfasst also die folgenden Schritte: