Supervisor(s)

Student

Related projects

RSNSR
Rule-Based Search in Text Data Bases with Nonstandard Spelling

Finished

2010-07

Formalia

Preconditions
  • Erfahrung in der Programmierung mit Java (absolut notwendig)
  • Java-Swing
  • Erfahrungen in UI-Design wären von Vorteil
  • Vorlesung Datenbanken oder Information Retrieval (notwendig)
  • Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen (notwendig)

Task description

Die deutsche Rechtschreibung wurde erst im Jahre 1901 vereinheitlicht. Durch die Abweichung von der aktuellen Standardschreibung sind historische Dokumente, oft nur schwer zu finden. Im Rahmen des Projektes RSNSR wird eine Suchmaschine zur Unterstützung der Suche in historischen Dokumenten entwickelt. Hierbei werden für den Suchbegriff zunächst die Flexionsformen in der Wortschatz-Datenbank nachgeschlagen. Diese werden anschließend mit automatisch generierten Regeln auf die entsprechenden Schreibvarianten abgebildet und die Suchanfrage entsprechend erweitert. Die Regeln werden dabei basierend auf Wortpaaren aus aktueller und historischer Schreibung (sog. Belegen) automatisch gebildet. Drüber hinaus soll der Benutzer auch die Gelegenheit bekommen selbst Regeln zu bearbeiten bzw. zu erstellen.

Sowohl die Schreibweisen als auch die Regeln sind zeit- und ortsabhängig. Dadurch müssen die Regeln jeweils an neue Korpora angepasst werden. Zur Vereinfachung dieses Prozesses soll ein User Interface erstellt werden, das dem Benutzer sowohl bei der Belegerstellung als auch bei der Regelerstellung eine interaktive Unterstützung bietet. Insbesondere sollen geeignete Übersichten über die Regelmengen und -kandidaten sowie die Belege visualisiert werden. Dabei soll der Benutzer keine tiefgreifenden Computerkenntnisse zur Bedienung benötigen. In das User Interface sollten auch bereits vorhandene Funktionen integriert werden.

Die Diplomarbeit umfasst insbesondere folgende Aspekte:

Result text

Ara Awakian (2010).
Development of a User Interface for Interactive Rule Generation. Masterthesis

Literature

Andrea Ernst-Gerlach; Norbert Fuhr (2007)
Retrieval in text collections with historic spelling using linguistic and spelling variants