Betreuer

Bearbeiter

Formalia

Zielgruppe
  • AI Bachelor
  • Komedia Bachelor
Voraussetzungen
  • Erfahrung in der Programmierung mit Java

Aufgabenstellung

In Rahmen des Projekts AMUR verfügen wir über Logfiles verschiedener Suchsysteme. Da diese Logfiles unterschiedlich aufgebaut und außerdem noch in verschiedenen Formaten sind, ist die Weiterverarbeitung sehr zeitaufwändig.

Aus der zeitlichen Abfolge von Logereignissen innerhalb einer Session sollen Sequenzen (Pfade) in einem einheitlichen Format abgeleitet werden. Diese Sequenzen sollen sowohl die von einem Benutzer durchgeführten Aktionen als ach die zeitliche Länge der jeweiligen Aktionen enthalten. Beispielsweise würde die Sequenz „qsssdm | 8.9:1.2:1.5:2.4:12.5:1.0“ bedeuten, dass der Benutzer zuerst eine Query formuliert und daraufhin sich drei Snippets angesehen hat. Auf das dritte Snippet hat er geklickt und sich das Dokument angeschaut, abschließend hat er das Dokument als relevant markiert. Die Zahlen am Ende (mit „:“ getrennt) geben an, wie lange die jeweilige Aktion gedauert hat.

In dieser Abschlussarbeit soll ein Framework entwickelt werden, welches Logfiles verschiedener Formate als Input nimmt und Sequenzen als Output produziert. Durch Interfaces und Abstrakte Klassen soll das Framework flexibel erweiterbar sein, um eventuell zukünftige unbekannte Logfiles verarbeiten zu können. Außerdem sollen (Unit)Tests geschrieben werden, die die Richtigkeit des Outputs gewährleisten.

Diese Abschlussarbeit umfasst also folgende Schritte: