 |
Finished diploma thesis:
IR im P2P-Netz JXTA
|
 |
Supervisor(s)
Student
Related projects
-
Pepper
-
Peer-to-Peer Architectures for Federated Search of Complex
Digital Libraries
Finished
2005-03
Formalia
- Preconditions
-
- Vorlesungen Datenbanken/Informationssysteme oder Information
Retrieval (notwendig)
- Gute Programmierfähigkeiten (notwendig)
- Gute Kenntnisse der Programmiersprache Java (notwendig)
Task description
Das Projekt PEPPER entwickelt
Methoden für das Information Retrieval in
Peer-to-Peer-Netzen. Peer-to-Peer-Netze (P2P) sind spontane
Verbindungen von Clients, denen eine zentrale Instanz (ein
zentraler Server) fehlt. Beispiele für
P2P-Netze, die dem Filesharing dienen, sind Napster (hier gibt es
allerdings einen zentralen Index), Gnutella und KaZaa. Die meisten P2P-Netze
suchen lediglich auf gleiche oder ähnliche Dateinamen oder Suche in
Metadaten, echtes Information Retrieval wird kaum geboten.
Das Routing der Anfrage im Netzwerk wird unterschiedlich
gehandhabt: Gnutella
[Ritter:01]
überflutet das gesamte
Netzwerk, während bei KaZaa einige ausgewählte Supernodes
entscheiden, wohin eine Suchanfrage weitergeleitet wird (mit
Information Retrieval hat aber auch das wenig zu tun).
Für unser Projekt PEPPER fehlt eine Basisarchitektur für
Resource Selection im Peer-to-Peer-Netzwerk. Hierzu ist das
P2P-Framework JXTA zu
verwenden. Die Topology wird ähnlich wie das mittlerweile tote
JXTA-Projekt JXTA Search
[Waterhouse:01]
aus Hubs
und Service Provider Peers bestehen. Es werden XML-Dateien
verwendet, die Anfrage in XIRQL
[Fuhr/Grossjohann:02]
beschrieben. Für die Resource
Selection wird derzeit der Ansatz in
[Nottelmann/Fuhr:03a]
für die dezentrale Auswahl in
P2P-Netzen erweitert.
Die Diplomarbeit entwickelt eine solche Basisarchitektur unter
Verwendung von:
- JXTA,
- vorhandenem Code für das Indexieren und Retrieval von
(XML-)Dateien,
- von uns entwickelten Verfahren für die Resource Selection
in P2P-Netzen,
- Programmcode für die Resource Selection bei zentraler
Auswahl, der angepaßt werden muß, und
- bereits vorhandener Datenquellen (TREC, Open
Archives).
Diese Diplomarbeit umfaßt damit folgende Schritte:
- Aufarbeitung der Literatur (JXTA, Gnutella, JXTA Search,
unser Resource-Selection-Ansatz)
- Entwicklung einer Basisarchitektur (grundlegender Klassen
für Hubs und Suchservices, Kommunikation, Messageformat
etc.),
- Integration der Resource Selection in diese Basisarchitektur,
- Implementierung im Rahmen von JXTA
Result text
-
Alexej Titarenko (2005).
-
Information Retrieval im P2P-Netz JXTA. Masterthesis
Literature
-
Jordan Ritter (2001).
-
Why Gnutella Can't Scale. No, Really..
-
Steve Waterhouse (2001).
-
JXTA Search: Distributed Search for Distributed Networks. Technical Report, Sun Microsystems, Inc.
-
N. Fuhr; K. Großjohann (2002).
-
XIRQL: An XML Query Language Based on Information Retrieval Concepts. (Submitted for publication)
-
H. Nottelmann; N. Fuhr (2003).
-
Evaluating different methods of estimating retrieval quality for resource selection. In SIGIR:03
|