Rework:Gesamtzusammenfassung
From Wiki
| « Daffuser Preferences | Übersicht | Anhang Vorträge » |
Contents |
Zusammenfassung
Ziele
Ziel des Studienprojekts war, auf Grundlage existierender Tools, ein Prototyp zu entwickeln, mit dem man Dokumente klassisch annotieren kann. Um die Annotationen mit einer Semantik zu versehen, sollten sie mit einer gegebenen Ontologie verknüpft werden. Neben der Annotation ganzer Dokumente sollte auch die Möglichkeit gegeben sein, einzelne Dokumentabschnitte zu annotieren und die Annotationen als Links zu anderen Dokumenten zu nutzen.
Die klassifizierbaren Annotationen sollten zum kontextbasierten Retrieval genutzt werden können, wodurch sich fortgeschrittene Suchmöglichkeiten ergeben, wie z.B. die semantische Suche nach Dokumenten.
Ausgehend von bestehenden Tools zur Annotation von PDF-Dokumenten soll eine erweiterte digitale Handbibliothek entwickelt werden, die folgende Möglichkeiten bieten soll:
- Verwaltung von interessanten gefundenen Dokumenten (PDF-Volltext) und bibliographischen Informationen
- Semantische Annotation von Dokumenten, evtl. Dokumentteilen und anderen Annotationen
- Browsen der Ontologie und Ausgabe aller mit einem Konzept verknüpften Dokumente
- Erweitertes, kontextbasiertes Retrieval durch Einbeziehung von Annotationen
- Teilen von Dokumenten, Annotationen und Ontologien innerhalb einer Gruppe (optional)
- Berücksichtigung der einfachen Integrationsmöglichkeit in bestehende Systeme, z.B. in Daffodil
Durchführung
Wir haben uns dazu entschieden, das Annotationssystem direkt in Daffodil zu integrieren. Dazu haben wir den Multivaltent Browser eingebunden, um Volltexte von pdf- und html-Dokumenten anzeigen und annotieren zu können. Des weiteren wurde mit Jena ein Tool eingebunden, welches die Annotationen persistent in einer Datenbank abspeichert, den Zugriff auf die Annotations-Ontologie unterstützt und ein Inferenz-Modell zur Verfügung stellt. PIRE wurde genutzt, um Volltextsuchen auf Annotationen auszuführen.
Ergebnis
Wir haben es geschafft, einen eigenen Annotationsdienst in Daffodil zu integrieren. Dokumente sowie Folder können direkt von der PLib aus annotiert werden. Der Multivalent-Browser ist in Daffodil integriert und zeigt Volltexte der Dokumente an, die auch annotierbar sind.
Es gibt eine Standardontologie für die Annotationstypen, die auch durch eigene Ontologien bzw. Erweiterungen der Ontologie ersetzt werden kann. Durch die Ontologie sind die Annotationen auch mit Semantik belegt.
Die Ausgabe aller mit einem Konzept verknüpften Dokumente ist dann möglich, wenn die Dokumente mit den entsprechenden Annotationstypen annotiert wurden.
Da alle Annotationen mit der Standardontologie für alle sichtbar und annotierbar sind, ist auch eine Diskussionsmöglichkeit durch Annotationen gegeben.
Eine eigene Verwaltung von PDF-Dokumenten konnten wir wegen Personalmangel nicht implementieren, aber dafür bietet Daffodil genug Möglichkeiten in der PLib.
Inwieweit die Anforderungen an Annotationssysteme umgesetzt wurden, findet man hier.
Etwas ausführlicher stehen einzelne Punkte in UseCases aus Benutzersicht und UseCases aus Systemsicht.
Ausblick
Im Verlauf des Projektes sind von uns zahlreiche Ideen diskutiert worden, was man noch verbessern, hinzufügen und umsetzen könnte. Da allerdings sowohl der Zeitraum des Projektes, als auch die personelle Besetzung recht eingeschränkt waren, bleibt uns nur noch die Möglichkeit, darauf hinzuweisen, was spätere Generationen von Studenten noch umsetzen könnten. Die Liste mit Ideen und Verbesserungsvorschlägen haben wir ebenfalls unterteilt, in eine Benutzersicht und eine Systemsicht.
| « Daffuser Preferences | Übersicht | Anhang Vorträge » |
