Universität Duisburg-Essen
Startseite Arbeitsgruppe Informationsysteme

"Researcher's Workbench": Aufgabe

Ontologie

Hintergrund

Eine der Hauptgründe, warum auch im Zeitalter von Digitalen Bibliotheken Dokumente immer noch auf Papier gedruckt werden ist, neben der besseren Lesbarkeit des Papierausdrucks, die fehlende Möglichkeit, elektronisch vorliegende Dokumente geeignet zu annotieren. Um den Inhalt eines Dokumentes zu verstehen und relevante Stellen schnell wiederzufinden, werden vom Leser z.B. solche Stellen mit einem Textmarker markiert oder es werden Kommentare oder Symbole an den Textrand geschrieben. Kommerzielle Systeme wie Adobes Acrobat Professional oder freie Tools wie der Multivalent Annotation Browser bieten mehr oder weniger eingeschränkte Annotationsmöglichkeiten für digitale Dokumente an.

Neben der Möglichkeit, Dokumente wie oben in klassischer Art und Weise zu annotieren, hat sich in letzter Zeit das Konzept der semantischen Annotation immer mehr durchgesetzt. Bei der semantischen Annotation werden Dokumente oder Teile von Dokumenten mit einer so genannten Ontologie verknüpft. Bei Ontologien handelt es sich um Wissensnetze, mit denen Konzepte der realen Welt miteinander in Beziehung gebracht werden und Wissen über ein bestimmtes Gebiet modelliert wird. Sehr simple Beispiele für Ontologien sind Thesauri und Kategorienschemata, wie man sie u.a. bei Yahoo!, dem Open Directory Project und bei der ACM Klassifikation vorfindet.

Im Studienprojekt soll, auf Grundlage existierender Tools, ein Prototyp entwickelt werden, mit dem man Dokumente wie oben erwähnt klassisch annotieren kann. Ferner soll die Möglichkeit geschaffen werden, Dokumente und Dokumentteile semantisch zu annotieren, also mit Konzepten einer gegebenen Ontologie zu verknüpfen. Somit wird neben dem reinen Text auch der Sinn der Annotation erfaßt. Dadurch können Dokumente Klassen zugeordnet werden, Annotationen selber sind klassifizierbar, und Annotationen können als Links zu anderen Dokumenten verwendet werden.

Nutzt man nun die Annotationen zum kontextbasierten Retrieval, ergeben sich fortgeschrittene Browsing- und Suchmöglichkeiten, die auch kompliziertere Anfragen an die Dokumentbasis ermöglichen, wie z.B. die Suche nach aufgezeichneten Ideen mit den dazugehörigen Dokumenten oder die semantische Suche nach Dokumenten. Ein weiteres Ziel des Projektes ist es also, solche Suchmechanismen in den Prototyp zu integrieren.

Aufgabe

Ausgehend von bestehenden Tools zur Annotation von PDF-Dokumenten (Acrobat Professional, Multivalent Annotation soll eine erweiterte digitale Handbibliothek entwickelt werden, die folgende Möglichkeiten bieten soll:

  • Verwaltung von interessanten gefundenen Dokumente (PDF-Volltext) und bibliographischen Informationen

  • Semantische Annotation von Dokumenten, evtl. Dokumentteilen, und anderen Annotationen

  • Browsen der Ontologie und Ausgabe aller mit einem Konzept verknüpften Dokumente

  • Erweitertes, kontextbasierten Retrieval durch Einbeziehung von Annotationen

  • Teilen von Dokumenten, Annotationen und Ontologien innerhalb einer Gruppe (optional)

  • Berücksichtiung der einfachen Integrationsmöglichkeit in bestehende Systeme, z.B. in Daffodil