 |
Abgeschlossene Diplomarbeit: Entwurf und Realisierung einer Daten-Definitions-Sprache
für Retrieval von XML-Dokumenten
|
 |
Betreuer
Bearbeiter
Abgabetermin
2000-05
Aufgabenstellung
In unserer Arbeitsgruppe wird zur Zeit ein neues
Information-Retrieval-System (IRS) entwickelt, das
insbesondere auch multimediale und strukturierte Dokumente
unterstützen soll. Als Standard-Datenformat ist dabei XML
vorgesehen. Um solche Dokumente verwalten zu können und
insbesondere auch effizient suchen zu können, muss die
Möglichkeit zur Definition entsprechender Schemata mit Hilfe
einer Datendefinitionssprache (DDL) geschaffen werden. Neben
der document type definition (DTD) der Dokumente müssen
folgende Arten von zusätzlichen Angaben im Rahmen der DDL
festgelegt werden:
- Spezifikation des Datentyps (einschließlich darauf
anzuwendender Suchprädikate) einzelner XML-Felder
- Strukturierung von Mengen von Dokumenten mit
unterschiedlichen DTDs, i.e. als Klassen von Dokumenten
- logische Abbildungen zwischen verschiedenen
Dokumentklassen (um einfachere Sichten auf Dokumente zu
realisieren oder um Dokumentklassen gemeinsam betrachten zu
können)
- Festlegung der (physischen) Zugriffsstrukturen
Mit Hilfe dieser Sprache kann dann das Schema eines IRS definiert
werden.
Zusätzlich sollen noch entsprechende Eingaberoutinen
automatisch generiert werden, um Mengen von Dokumenten in das
IRS einbringen zu können.
|