 |
"Researcher's Workbench": Aufgabe
|
 |
Eine der Hauptgründe, warum auch im Zeitalter
von Digitalen Bibliotheken Dokumente immer noch auf Papier gedruckt
werden ist, neben der besseren Lesbarkeit des Papierausdrucks, die
fehlende Möglichkeit, elektronisch vorliegende Dokumente geeignet zu
annotieren. Um den Inhalt eines Dokumentes zu verstehen und relevante
Stellen schnell wiederzufinden, werden vom Leser z.B. solche Stellen
mit einem Textmarker markiert oder es werden Kommentare oder Symbole
an den Textrand geschrieben. Kommerzielle Systeme wie
Adobes Acrobat Professional oder
freie Tools wie der
Multivalent Annotation Browser bieten mehr oder weniger
eingeschränkte Annotationsmöglichkeiten für digitale Dokumente an.
Neben der Möglichkeit, Dokumente wie oben in klassischer Art und Weise
zu annotieren, hat sich in letzter Zeit das Konzept der semantischen
Annotation immer mehr durchgesetzt. Bei der semantischen Annotation
werden Dokumente oder Teile von Dokumenten mit einer so genannten
Ontologie verknüpft. Bei Ontologien
handelt es sich um Wissensnetze, mit denen Konzepte der realen Welt
miteinander in Beziehung gebracht werden und Wissen über ein
bestimmtes Gebiet modelliert wird. Sehr simple Beispiele für
Ontologien sind Thesauri und Kategorienschemata, wie man sie u.a. bei
Yahoo!, dem Open Directory Project und bei der
ACM Klassifikation vorfindet.
Im Studienprojekt soll, auf Grundlage existierender Tools, ein
Prototyp entwickelt werden, mit dem man Dokumente wie oben erwähnt
klassisch annotieren kann. Ferner soll die Möglichkeit geschaffen
werden, Dokumente und Dokumentteile semantisch zu annotieren, also mit
Konzepten einer gegebenen Ontologie zu verknüpfen. Somit wird neben
dem reinen Text auch der Sinn der Annotation erfaßt. Dadurch können
Dokumente Klassen zugeordnet werden, Annotationen selber sind
klassifizierbar, und Annotationen können als Links zu anderen
Dokumenten verwendet werden.
Nutzt man nun die Annotationen zum kontextbasierten Retrieval, ergeben
sich fortgeschrittene Browsing- und Suchmöglichkeiten, die auch
kompliziertere Anfragen an die Dokumentbasis ermöglichen, wie z.B. die
Suche nach aufgezeichneten Ideen mit den dazugehörigen Dokumenten oder
die semantische Suche nach Dokumenten. Ein weiteres Ziel des Projektes
ist es also, solche Suchmechanismen in den Prototyp zu integrieren.
Ausgehend von bestehenden Tools zur Annotation von PDF-Dokumenten (Acrobat
Professional, Multivalent Annotation
soll eine erweiterte digitale Handbibliothek entwickelt werden, die folgende
Möglichkeiten bieten soll:
-
Verwaltung von interessanten gefundenen Dokumente (PDF-Volltext)
und bibliographischen Informationen
-
Semantische Annotation von Dokumenten, evtl. Dokumentteilen, und anderen
Annotationen
-
Browsen der Ontologie und Ausgabe aller mit einem Konzept
verknüpften Dokumente
-
Erweitertes, kontextbasierten Retrieval durch Einbeziehung
von Annotationen
-
Teilen von Dokumenten, Annotationen und Ontologien innerhalb einer
Gruppe (optional)
-
Berücksichtiung der einfachen Integrationsmöglichkeit
in bestehende Systeme, z.B. in Daffodil
|