Universität Duisburg-Essen
Startseite Arbeitsgruppe Informationsysteme

Pepper

Peer-to-Peer-Architekturen für die föderierte Suche in komplexen digitalen Bibliotheken


Projektzeitraum:
Vom 01. 11. 2003 bis zum 31. 12. 2006
Kontaktpersonen:
Beteiligte Personen:
Gesponsert von:
  • DFG
  • NSF
Referenznummer:
  • DFG: BIB47 DOuv 02-01
  • UDE: 15311523 (ka00043c)
Teilnehmende Institutionen:

Die Anzahl Digitaler Bibliotheken (Digital Libraries, DL) und Services im Web wächst sowohl in absoluten Zahlen als auch in Sachen Vielfältigkeit. Aus Benutzersicht sollte es eine eine einzige virtuelle Bibliothek geben (``one stop shop''), die alle relevanten Quellen zur Befriedigung des Informationsbedürfnisses beinhaltet. Peer-to-Peer Architekturen haben sich als effektiv zur Integration zahlreicher sehr einfacher DLs, z.B. für das Filesharing, erwiesen. Dieses Projekt wird zeigen, daß sich Peer-to-Peer-Architekturen auch für die föderierte Suche in sehr vielen, komplexen und nur lose gekoppelten Digitalen Bibliotheken eignet

Das Projekt basiert auf der Annahme, daß es weder möglich noch erstrebenswert ist, Homogenität in eine sehr größe Föderation komplexer DLs durchzusetzen. Bibliotheken unterscheiden sich in Bezug auf das Schema, das ihre Dokumente verwenden, die Qualität der Daten und den Grad der Kooperativität. Wir werden Methoden zur Übersetzung von Anfragen und Dokumente von einem Schema in ein anderes entwickeln, die die inhärente Unsicherheit und Vagheit solcher Mappings berücksichtigt. Hierfür müssen Mehtoden zur Beschreibung von Schemata und den Abbildungen zwischen ihnen entwickelt werden.

Eine wachsende Anzahl von Web-Services kann zur Verbesserung der Retrievalqualität verwenden werden: Mapping-Services helfen, die Heterogenität zu überwinden, und andere Services liefern weitere relevante Dokumente. Wir werden Methoden zur Beschreibung und dynamischen Auswahl solcher Services entwickeln.

Große Peer-to-Peer-Netze erfordern Services, die das Weiterleiten von Anfragen im Netz effizient regeln. Wir werden Methoden für inhaltsbezogene Routing-Services (für Beschreibungen von DLs, Resource Selection und Data Fusion) in Peer-to-Peer-Netzen bereitstellen. Diese Services werfen eine Reihe neuer Fragen auf, z.B. wie partielle Beschreibungen der DLs verwendet werden können, oder die komplexere Aufgabenstellung ob eine Frage lokal behandelt werden kann oder zu einem anderen Knoten weitergeleitet werden soll.

Um unsere Methoden und die Implementierungen derselben für andere Wissenschaftler und Entwickler verfügbar zu machen, werden wir unser Methoden mit Hilfe von JXTA implementieren, das derzeit in zahlreichen weiteren Projekten verwendet wird.


Publikationen

Henrik Nottelmann; Gudrun Fischer (2007).
Search and browse services for heterogeneous collections with the peer-to-peer network Pepper. Information Processing & Managementt 43

Nottelmann, Henrik; Fuhr, Norbert (2007).
A Decision-Theoretic Model for Decentralised Query Routing in Hierarchical Peer-To-Peer Networks. In ECIR:07

Nottelmann, Henrik; Aberer, Karl; Callan, Jamie; Nejdl, Wolfgang (2006).
The CIKM 2005 Workshop on Information Retrieval in Peer-to-Peer Networks. SIGIR Forum 40(1)

Nottelmann, Henrik; Fuhr, Norbert (2006).
Comparing different architectures for query routing in peer-to-peer networks. In ECIR:06

Nottelmann, Henrik; Straccia, Umberto (2006).
A Probabilistic, Logic-based Framework for Automated Web Directory Alignment. In: Zongmin Ma (Hrsg.):

Henrik Nottelmann; Umberto Straccia (2006).
Information retrieval and machine learning for probabilistic schema matching. Information Processing and Management 43

Gudrun Fischer; André Nurzenski (2005).
Towards Scatter/Gather Browsing in a Hierarchical Peer-to-Peer Network. In P2PIR:05

H. Nottelmann (2005).
PIRE: An extensible IR engine based on probabilistic Datalog. In ECIR:05

Henrik Nottelmann (2005).
Inside PIRE: An extensible, open-source IR engine based on probabilistic logics. Technischer Bericht, University of Duisburg-Essen

Henrik Nottelmann; Gudrun Fischer; Alexej Titarenko; André Nurzenski (2005).
An integrated approach for searching and browsing in heterogeneous peer-to-peer networks. In HDIR:05

H. Nottelmann; N. Fuhr (2006).
Adding Probabilities and Rules to OWL Lite Subsets based on Probabilistic Datalog. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems 14(1)

H. Nottelmann; U. Straccia (2005).
sPLMap: A probabilistic approach to schema matching. In ECIR:05

Henrik Nottelmann; Umberto Straccia (2005).
Information retrieval and machine learning for probabilistic schema matching (poster). In CIKM:05

Henrik Nottelmann; Karl Aberer; Jamie Callan; Wolfgang Nejdl (Hrsg.) (2005).
Proceedings of the 2005 ACM Workshop on Information Retrieval in Peer-to-Peer Networks (P2PIR 2005), Bremen, Germany, November 4, 2005.

H. Nottelmann; N. Fuhr (2004).
Combining CORI and the decision-theoretic approach for advanced resource selection. In ECIR:04

Henrik Nottelmann; Norbert Fuhr (2004).
pDAML+OIL: A probabilistic extension to DAML+OIL based on probabilistic Datalog. In IPMU:04

H. Nottelmann; N. Fuhr (2004).
A logic-based approach for computing service executions plans in peer-to-peer networks. In P2PIR:04

N. Fuhr; C.-P. Klas (2001).
Combining RDF and Agent-Based Architectures for Semantic Interoperability in Digital Libraries. In DELOS-Interoperability:01


Vorträge

Norbert Fuhr (2007).
A Decision-Theoretic Model for Decentralised Query Routing in Hierarchical Peer-To-Peer Networks. Talk at the European Conference on Information Retrieval Research, Rome, Italy

Norbert Fuhr (2006).
Comparing different architectures for query routing in peer-to-peer networks. Talk at the Max-Planck-Institute of Informatics (Saarbrücken, Germany)

Henrik Nottelmann (2005).
Pepper - Information Retrieval in hierarchical Peer-to-Peer networks with heterogeneous services. Talk at the 'P2PIR in Germany' workshop (Leipzig)

Henrik Nottelmann (2005).
Decision-theoretic resource selection in hierarchical peer-to-peer networks. Talk at the CMU LTI group meeting

Henrik Nottelmann; Gudrun Fischer; Alexej Titarenko; André Nurzenski (2005).
An integrated approach for searching and browsing in heterogeneous peer-to-peer. Talk at the HDIR 2005 workshop (co-located with SIGIR)

Henrik Nottelmann (2003).
Probabilistic logics for defining and using P2P service descriptions. Workshop on Metadata Management in Grid and Peer-to-Peer Systems (MMGPS), London

Henrik Nottelmann (2003).
Probabilistic logics for defining and using P2P service descriptions. QMIR Seminar, London


Diplom-, Master- und Bachelorarbeiten

Information Retrieval im Semantic Web
Abgeschlossene Diplomarbeit
Service-Beschreibungen in Peer-to-Peer-Netzen
Abgeschlossene Masterarbeit
Cluster-basiertes Browsing in Peer-to-Peer-Netzen
Abgeschlossene Diplomarbeit
IR im P2P-Netz JXTA
Abgeschlossene Diplomarbeit

Verwandte Projekte

DAFFODIL
Nutzerorientiertes Zugangssystem für heterogene Digitale Bibliotheken
MIND
Auswahl geeigneter Datenbanken und Kombination der Retrievalergebnisse für multimediale internationale digitale Bibliotheken

Projektreffen

21./22. November 2004, Pittsburgh:
Technisches Treffen
25. Juli 2004, Sheffield:
Technisches Treffen
8./9. März 2004, Duisburg:
Technisches Treffen
10./11. November 2003, Pittsburgh:
Kick-off-Treffen

Testdaten

DTF in P2P-Netzwerken:
Benutzt im ECIR-2006-Paper (300 KB)
Schema-Mapping:
BIBDB, OAI (3 MB) (down)