Rework:Hintergruende

From Wiki

Jump to: navigation, search
« Motivation Übersicht Konfiguration »

Contents

Hintergründe

Annotationssysteme

Im Folgenden eine Zusammenfassung des Seminarvortrags zum Thema Annotationssysteme.

Annotationsformen

Texte sind auf viele verschiedene Weisen annotierbar. Man kann Notizen einfügen, wichtige Textpassagen highlighten oder Symbole einsetzen. Digitale Dokumente bieten des Weiteren den Vorteil, durch Hyperlinks auf andere Texte oder Passagen referenzieren zu können, was in Papierform nur mittels eines Quellenverweises möglich ist.

Vorteile von Annotationen

Texte zu annotieren bringt vielfältige Vorteile mit sich. So werden die annotierten Dokumente um zusätzliche Informationen erweitert, die man selbst z.B. zum besseren Verständnis des Textinhaltes nutzen kann, die aber auch für andere Personen von Nutzen sein können, um Texte schneller und besser zu erfassen. Digitale Annotationen, um die es hier in erster Linie geht, bieten noch viele weitere Vorteile: Man kann alle Annotationsformen des handschriftlichen Annotierens in leserlicher Form übernehmen. Sie erleichtern das Sharing von Annotationen z.B. zu Diskussionszwecken. Als störend empfundene Annotationen können jederzeit ausgeblendet werden.

Nutzen von Annotationen

Der Nutzen von Annotationen wird in vielen Texten diskutiert.
Ovsiannikov unterscheidet zwischen 4 Nutzungsmöglichkeiten:

  • Remember: Annotationen zur Erinnerung, Zusammenfassung von Kernaussagen
  • Think: Anregungen zum Nachdenken, Fragen, Gedanken, Bemerkungen, eigene Ideen
  • Clarify: Klärung von komplizierten Sachverhalten
  • Share: Austausch von Gedanken, Diskussionen

Digitale Annotationen sind weiterhin als Metadaten z.B. zur Objektbeschreibung nutzbar.

Anforderungen an Annotationssysteme und deren Umsetzung

  • Erstellung der Annotationen in komfortabler Weise: Die Annotationen werden über Dialogfenster erstellt. Der User kann also schrittweise seinen Annotationen Form geben.
  • Darstellung von Annotationen als Teil des Dokuments: Die Annotationen können im Multivalent Browser dargestellt werden, wenn sie auch im MVB erstellt wurden.
  • Formen und Varianten der Annotation ausdrucksstark und vielfältig: Durch die Standard-Ontologie werden bereits viele Formen und Varianten zur Verfügung gestellt.
  • Integration des Annotierens in das Lesen: Während des Lesens können die Texte im MVB direkt annotiert werden. Durch den Aufruf neuer Fenster zur Annotationserstellung wird man nur geringfügig im Lesefluss unterbrochen.
  • Robustheit der Annotationen: Ist gegeben, da Annotationen nur dann editierbar und löschbar sind, wenn sie keine weiteren Annotationen enthalten. Da die Dokumenttexte in unserem Annotationssystem nicht verändert werden können, stellt sich auch die Frage nach Veränderungen des Dokumentes an annotierten Stellen nicht mehr.
  • Unterscheidung zwischen privaten und öffentlichen Annotationen: Die Annotationen sind für alle sichtbar. Allerdings sind die Annotationen nur vom Autor selbst editierbar und löschbar.
  • Verschachtelung von Annotationen ermöglichen: Alle Annotationen sind ihrerseits wieder annotierbar.
  • Formatunabhängigkeit: Es können sämtliche Dokumente (pdf, html, ...) sowie Folder annotiert werden.
  • Plattformunabhängigkeit: Durch die Implementierung in Java sollte die Plattformunabhängigkeit gewährleistet sein.
  • Erweiterungsfähigkeit: Eigene Annotationstypen sind durch eigene Annotationstyp-Ontologien, bzw. der Erweiterung der Standard-Ontologie ermöglicht.

Ontologien, OWL

Im Folgenden eine Zusammenfassung des Seminarvortrags zum Thema Semantic Web, Ontologien, OWL. Eine Liste mit Literatur zu diesen Themen befindet sich auf der Vortragsseite.

Semantic Web

Eine anspruchsvolle, maschinelle Auswertung der im heutigen World Wide Web gespeicherten Inhalte ist nur schwer möglich. Der Grund dafür ist, dass die Inhalte oft repräsentationsorientiert sind und von einem menschlichen Nutzer interpretiert werden müssen. Die Bedeutung der Inhalte bleibt einer Maschine aufgrund fehlender maschinenlesbarer, semantischer Informationen und einem mangelndem Sprachverständnis verborgen. Suchmaschinen beschränken sich daher meist auf die Auswertung von Termhäufigkeiten und die Darstellung der Ergebnisse. Die Idee hinter dem Semantic Web ist nun eine Erweiterung des Webs, um durch den Menschen hinzugefügte Semantik in maschinenlesbarer Form. Um es so zu einem universellen Kommunikationsmittel für Mensch und Maschine zu machen und Inhalte automatisch durch Software-Agenten verarbeiten zu können.

Ontologien und Desciption Logics

Das für eine maschinelle Verarbeitung benötigte Wissen kann durch Ontologien zur Verfügung gestellt werden. Mit dem aus der Philosophie stammenden Begriff Ontologie wird eine Theorie der Existenz von Dingen beschrieben. Eine Ontologie definiert Beziehungen zwischen Konzepten, um so ein Wissensgebiet abstrakt zu beschreiben und zu repräsentieren. Inferenz-Regeln ermöglichen automatische Schlüsse für implizites Wissen. Verwendete Begriffe erhalten durch einen Verweis auf eine Ontologie Bedeutung. Sie sind Instanzen eines bestimmten Konzepts. Beispiele für Ontologiesprachen sind Entity-Relationship-Diagramme zum abstrakten Entwurf von rationalen Datenbanken oder UML-Diagramme zum Entwurf objektorientierter Programme. Ein Problem von netzwerkbasierten Strukturen ist jedoch die oft vage Beschreibung so, dass die Semantik nicht immer eindeutig ist.

Description Logics sind eine Familie von Formalismen zur Wissensrepräsentation, die eine Formulierung einer wohl-definierten Semantik und damit eine Verwendung von Inferenzdiensten erlauben. Sie unterscheiden sich durch die bereitgestellten Konstruktoren zur Beschreibung von Konzepten und damit durch ihre Ausdruckskraft und Komplexität. Das Wissen wird in einer Wissensbasis gespeichert, die aus zwei Komponenten besteht: der TBox und der ABox. Während die TBox das intensionale Wissen durch terminologische Axiome beschreibt und definiert, wie Konzepte zueinander in Beziehung stehen, beschreibt die ABox das extensionale Wissen durch Aussagen über Instanzen bezüglich einer TBox. Sie ordnet Objekte also bestimmten Konzepten zu. Beispiele befinden sich auf den Vortragsfolien.

OWL und Protégé OWL-Plugin

Die Web Ontologie Language (OWL) ist eine Beschreibungssprache zum Erstellen von Ontologien. Der Entwurf wurde stark durch Description Logics beeinflusst. OWL basiert auf RDF und wird in der auch für den Menschen lesbaren XML-Syntax formuliert. Es existieren drei Sprachebenen mit unterschiedlicher Komplexität und Ausdruckskraft. OWL Lite ist für einfache Klassifikationshierarchien und Einschränkungen gedacht. Mit OWL DL (Description Logic) erhält man die größtmögliche Ausdruckskraft, bei der die Entscheidbarkeit noch gesichert ist. OWL Full bietet die maximale Ausdruckskraft und syntaktische Freiheit, jedoch sind unentscheidbare Ontologien möglich. Die XML-Elemente zur Beschreibung der Klassen, Eigenschaften und Instanzen sind auf den Folien beschrieben. Dort gibt es auch Beispiele für DL-Ausdrücke mit den entsprechenden OWL-Teilen.

Für die Open-Source Entwicklungsumgebung für Ontologien Protégé steht ein OWL-Plugin zur Verfügung. Dieses Plugin bietet benutzerfreundliche Werkzeuge zur Erstellung und Pflege von OWL-Ontologien. Es gibt Sichten zum Erstellen und Bearbeiten von Klassen (OWL Classes tab), Eigenschaften (Properties tab), Instanzen (Individual stab) und für Ontologie Metadaten und Namespaces (Metadata tab)

Multivalent Architektur

Der Multivalent-Browser entstand an der Berkeley-Universität. Hauptautor ist Thomas A. Phelps, Mitglied des UCB Digital Library Projektteams. Die Idee hinter dem Multivalent Browser ist es, eine einheitliche Schnittstelle für jegliche meschenlesbare Dokumente zu schaffen und zudem leicht erweiterbar zu sein. Die Schlagworte dabei sind: Anytime, anywhere, Any type und Every way. Der Multivalent-Browser arbeitet intern mit einem Metaformat, in welches Beispielsweise CSII,PDF,DVI,man-pages,etc. problemlos importiert werden können. Der Vorteil ist liegt auf der Hand. Jegliche Funktionen, die ein Dokument in irgendeiner Weise zu verändern können, müssen nur ein einziges Mal programmiert werden.

Link -> MVB in Daffodil

« Motivation Übersicht Konfiguration »
Personal tools