Supervisor(s)

Student

Related projects

Pepper
Peer-to-Peer Architectures for Federated Search of Complex Digital Libraries

Finished

2005-03

Formalia

Preconditions
  • Vorlesungen Datenbanken/Informationssysteme oder Information Retrieval (notwendig)
  • Gute Programmierfähigkeiten (notwendig)
  • Gute Kenntnisse der Programmiersprache Java (notwendig)

Task description

Das Projekt PEPPER entwickelt Methoden für das Information Retrieval in Peer-to-Peer-Netzen. Peer-to-Peer-Netze (P2P) sind spontane Verbindungen von Clients, denen eine zentrale Instanz (ein zentraler Server) fehlt. Beispiele für P2P-Netze, die dem Filesharing dienen, sind Napster (hier gibt es allerdings einen zentralen Index), Gnutella und KaZaa. Die meisten P2P-Netze suchen lediglich auf gleiche oder ähnliche Dateinamen oder Suche in Metadaten, echtes Information Retrieval wird kaum geboten. Das Routing der Anfrage im Netzwerk wird unterschiedlich gehandhabt: Gnutella [Ritter:01] überflutet das gesamte Netzwerk, während bei KaZaa einige ausgewählte Supernodes entscheiden, wohin eine Suchanfrage weitergeleitet wird (mit Information Retrieval hat aber auch das wenig zu tun).

Für unser Projekt PEPPER fehlt eine Basisarchitektur für Resource Selection im Peer-to-Peer-Netzwerk. Hierzu ist das P2P-Framework JXTA zu verwenden. Die Topology wird ähnlich wie das mittlerweile tote JXTA-Projekt JXTA Search [Waterhouse:01] aus Hubs und Service Provider Peers bestehen. Es werden XML-Dateien verwendet, die Anfrage in XIRQL [Fuhr/Grossjohann:02] beschrieben. Für die Resource Selection wird derzeit der Ansatz in [Nottelmann/Fuhr:03a] für die dezentrale Auswahl in P2P-Netzen erweitert.

Die Diplomarbeit entwickelt eine solche Basisarchitektur unter Verwendung von:

Diese Diplomarbeit umfaßt damit folgende Schritte:

Result text

Alexej Titarenko (2005).
Information Retrieval im P2P-Netz JXTA. Diplomarbeit

Literature

Jordan Ritter (2001).
Why Gnutella Can't Scale. No, Really..
Steve Waterhouse (2001).
JXTA Search: Distributed Search for Distributed Networks. Technical Report, Sun Microsystems, Inc.
N. Fuhr; K. Großjohann (2002).
XIRQL: An XML Query Language Based on Information Retrieval Concepts. (Submitted for publication)
H. Nottelmann; N. Fuhr (2003).
Evaluating different methods of estimating retrieval quality for resource selection. In Proceedings of the 26th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval