Rework:Motivation
From Wiki
| « | Übersicht | Hintergründe » |
Contents |
Motivation und Aufgabenstellung
Ausgangslage
Jeder, der mit Texten arbeitet und auf Teilinformationen dieser später zurückzugreifen möchte, wird sich ab einem gewissen Umfang eine Systematik zur Ablage überlegen. Bis jetzt geschieht dies hauptsächlich noch auf Papier. Man schreibt in seine ausgedruckten Texte hinein und markiert wichtige Passagen. Wichtige Dokumente oder Dokumentstellen hält man danach möglicherweise in einer Kartei fest. Da aber der Großteil der heutigen Daten digital produziert und verarbeitet werden, liegt es nahe, diese Systematik auch auf digitale Medien umzusetzen. Nebenbei eröffnet dieser Schritt eine Reihe weiterer interessanter Möglichkeiten.
Stand der Technik
Auch wenn der Schritt vom Papier zur digitalen Verwaltung nahe liegt, gibt es bis jetzt noch keine zufrieden stellenden Lösungen. Mit Programmen wie Acrobat Professional oder dem Multivalent Browser ist es möglich Dokumente zu annotieren. Acrobat unterstützt darüber hinaus auch die gemeinsame Arbeit an einem Dokument. Dies beschränkt sich allerdings auf das einfache Teilen seiner Markierungen und Bemerkungen.
Motivation
Wirklich interessant wird diese Technik, wenn man zu seinen Annotationen auch semantische Informationen hinzufügen kann. Dies würde erst einmal bedeuten, dass für einen fremden Leser sofort ersichtlich wäre, was diese oder jene Annotation in einem Dokument zu suchen hat. Wenn man diese Funktion nur auf ein Dokument beschränkt sieht, könnte man gezielt nach Unstimmigkeiten zu suchen, die ein Anderer zuvor aufgedeckt hat. Interessant wäre es auch, alle möglichen Definitionen eines Begriffs zu annotieren und als semantische Information „Definition“ und diesen Begriff beizufügen. Im Anschluss könnte somit eine einzige Suche alle Definitionen zu z.B. Information Retrieval liefern. Diese Beispiele zeigen deutlich, dass eine Umsetzung mehr als interessant ist.
Aufgabenstellung
Unsere Aufgabe ist es, die beispielhaften Ausführungen aus dem letzten Absatz soweit wie möglich programmtechnisch umzusetzen. Durch die Neuartigkeit wird das ganze ein Proof-of-Concept werden. Die neuen Funktionen sollen dabei in das bestehende Programm Daffodil (Distributed Agents for User-Friendly Access of Digital Libraries) integriert werden. Nach Abschluss soll es möglich sein, Dokumente rudimentär zu annotieren. Außerdem soll eine Ontologie erstellt werden, die eine geeignete semantische Annotation erlaubt. Letztendlich soll ein Prototyp entstehen, der es erlaubt Dokumente semantisch zu annotieren und zu durchsuchen.
| « | Übersicht | Hintergründe » |
