Supervisor(s)

Student

Finished

2008-11

Formalia

Targeted audience
  • DAI Hauptstudium: Bereich "D"
Preconditions
  • Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen (notwendig)
  • Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
  • Vorlesung Data Mining oder Information Retrieval (notwendig)
  • Erfahrung in der Programmierung mit Java (absolut notwendig)

Task description

Anreicherung von eingehenden Emails mittels Kategorisierung und Informationsextraktion

In Untermehmensprozessen nehmen Emails eine wichtige Rolle ein, weswegen wir uns in dieser Diplomarbeit mit dem so genannten Inbox-Szenario in einem Helpdesk beschäftigen wollen. Im Inbox-Szenario werden eingehene Emails und deren weitere Verarbeitung betrachtet. Eingehende Emails können bestimmten Problemklassen zur (automatischen oder manuellen) Weiterverarbeitung vorgelegt werden, was durch eine Multifacettenklassifikation geschieht [Frommholz/Fuhr:06b] . So kann in einem Helpdesk-Szenario automatisch bestimmt werden, ob eine Email einer sofortigen Bearbeitung bedarf oder nicht, und zu welchem Produkt überhaupt eine Anfrage gestellt wurde. In diesem Sinne würden Emails also einen Geschäftsprozess anstossen. Zur Unterstützung beider Fälle sollen per Email eingehende Support-Anfragen vor der Weiterverarbeitung hinsichtlich bestimmter Kriterien (topikalisch (welches Produkt?), aber auch z.B. Priorität) automatisch klassifiziert werden. Dabei kann Kontextinformation wie z.B. die Verknüpfung von Personen zu Firmen benutzt werden.

Die Diplomarbeit umfasst daher folgende Schritte:

Die Diplomarbeit wird in Zusammenarbeit mit der d.velop AG durchgeführt werden. d.velop wird Demo-Firmendaten und Emails zur Verfügung stellen, beim Aufbau einer Ontologie und bei der Definition von beispielhaften wissensintensiven Aufgaben behilflich sein.

Literature

Ingo Frommholz; Norbert Fuhr (2006).
KI-Methoden zur Email-Archivierung -- Technologische Studie zum "Inbox-Szenario".