Universität Duisburg-Essen
Startseite Arbeitsgruppe Informationsysteme

Vergebene Diplomarbeit: Semantische Annotation und Retrieval von Emails zur Unterstützung wissensintensiver Prozesse

Betreuer

    Bearbeiter

    • Evgenia Nikiforova

    Formalia

    Zielgruppe
    • DAI Hauptstudium: Bereich "E"
    Voraussetzungen
    • Fähigkeit im Lesen und Verstehen englischer wissenschaftlicher Publikationen (notwendig)
    • Fähigkeit und Interesse, sich in neue theoretische und praktische Aspekte einzuarbeiten
    • Vorlesung Data Mining oder Information Retrieval (notwendig)
    • Erfahrung in der Programmierung mit Java (absolut notwendig)

    Aufgabenstellung

    Heutige Knowledge Management-Systeme bilden Unternehmensprozesse in Form von Workflows und Geschäftsprozessen ab. Diese formalisieren Unternehmensprozesse wie z.B. die Aufnahme eines neuen Geschäftskontaktes oder die Beschaffung neuer Hardware. Derartige Prozesse sind in einzelne Aufgaben unterteilt, von denen einige, die so genannten wissensintensiven Aufgaben, die kontext- und prozessabhängige Bereitstellung der zur Entscheidungsfindung nötigen Information erfordern. Innerhalb dieser wissensintensiven Aufgaben entstehen Informationsbedürfnisse, die von so genannten Informationsagenten gestillt werden sollen. Diese Informationsagenten stellen dabei Anfragen an das Organizational Memory, der Ansammlung des gesamten Wissens einer Organisation [Abecker/etal:00] .

    Anreicherung von eingehenden Emails mittels Kategorisierung und Informationsextraktion

    In Untermehmensprozessen nehmen Emails eine wichtige Rolle ein, weswegen wir uns in dieser Diplomarbeit mit dem so genannten Inbox-Szenario und wissensintensiven Prozessen beschäftigen wollen. Im Inbox-Szenario werden eingehene Emails und deren weitere Verarbeitung betrachtet. So können eingehende Emails bestimmten Problemklassen zur (automatischen oder manuellen) Weiterverarbeitung vorgelegt werden. So kann in einem Helpdesk-Szenario automatisch bestimmt werden, ob eine Email einer sofortigen Bearbeitung bedarf oder nicht. In diesem Sinne würden Emails also einen Geschäftsprozess anstossen. Ferner kann das Email-Archiv für wissensintensive Aufgaben als Informationsquelle abgerufen werden [Frommholz/Fuhr:06b] . Zur Unterstützung beider Fälle sollen eingehende Emails mittels Methoden der Email-Kategorisierung und Informationsextraktion semantisch annotiert (d.h. als Instanzen von Klassen einer Ontologie identifiziert [Handschuh/Staab:03] ), indexiert und mit zusätzlicher Information angereichert werden, bevor sie in der Inbox abgelegt werden. Dabei kann Kontextinformation wie z.B. die Verknüpfung von Personen zu Firmen benutzt werden.

    Die Diplomarbeit umfasst daher folgende Schritte:

    • Aufarbeitung der Literatur
    • Analyse der Demo-Daten und Aufbau einer Beispielontologie (in Zusammenarbeit mit der d.velop AG, siehe unten)
    • Anwendung von Informationsextraktions- und Kategorisierungsverfahren zur semantischen Annotation und Kategorisierung von Emails
    • Definition von beispielhaften wissensintensiven Aufgaben
    • Entwurf, Anwendung und Evaluation semantischer Suchalgorithmen für wissensintensive Aufgaben, unter Berücksichtigung des Prozesskontexts

    Die Diplomarbeit wird in Zusammenarbeit mit der d.velop AG durchgeführt werden. d.velop wird Demo-Firmendaten und Emails zur Verfügung stellen, beim Aufbau einer Ontologie und bei der Definition von beispielhaften wissensintensiven Aufgaben behilflich sein.

    Literatur

    Andreas Abecker; Ansgar Bernardi; Knut Hinkelmann; Otto Kühn; Michael Sintek (2000).
    Context-Aware, Proactive Delivery of Task-Specific Knowledge: The KnowMore Project. International Journal on Information System Frontiers (ISF) 2((3/4))

    Ingo Frommholz; Norbert Fuhr (2006).
    KI-Methoden zur Email-Archivierung -- Technologische Studie zum "Inbox-Szenario".

    Siegfried Handschuh; Steffen Staab (Hrsg.) (2003).
    Annotation for the Semantic Web. , IOS Press