Peer-to-peer Netzwerke ermöglichen ein dezentrales Anbieten und Suchen von Daten. Um nach Daten suchen zu können, muss man dabei allerdings genau wissen, was man sucht. Dies ist häufig nicht der Fall. Im Internet haben sich als alternative Suchstrategie Webkataloge, wie Yahoo oder Open Directory etabliert, in denen die Daten (in diesem Fall Webseiten) hierarchisch in Kategorien strukturiert sind.
Diese Idee soll nun auf Peer-to-peer Netze übertragen werden. Konsequenterweise, kann in diesem Fall jeder Benutzer sein eigenes, lokales Klassifikationschema haben. Dieses reflektiert die individuelle Sicht dieses Nutzers auf die an seinem Knoten gespeicherten und angebotenen Daten.
Solche
lokalen Klassifikationsschemata dienem einem Nutzer zunächst
selbst dazu, seine Daten zu verwalten. Sie können aber natürlich
auch für andere Nutzer nützlich sein. Im einfachsten Fall
können sie anderen dazu dienen, sich durch die Datenkollektion
dieses Nutzers zu browsen. Durch den Einsatz von Techniken des
Maschinellen Lernens ergeben sich allerdings noch ganz andere
Möglichkeiten. Beispielsweise könnte ein Benutzer A die
Daten von einem Benutzer B in sein eigenes Klassifikationsschema
einsortieren lassen, um so die Daten von B durch seine eigene Brille
zu sehen.
Um eine solche Art von Verarbeitung zu ermöglichen, müssen die Daten zunächst geeignet kodiert werden. Dazu werden Methoden der Merkmalsextraktion angewendet. Für Musikstücke heißt das beispielsweise, dass Eigenschaften wie Tempo, Rhythmus, etc. aus den entsprechnden mp3 Dateien extrahiert werden müssen, um diese zu beschreiben. Ein Lernalgorithmus kann dann diese Eigenschaften nutzen, um ähnliche Musikstücke zusammen zu gruppieren. Das Yalesystem, welches hier am Lehrstuhl erstellt wurde, stellt entsprechende Methoden zur Merkmalsextraktion zur Verfügung.
Aufgabe der PG ist es auf Basis des Yale Systems die oben beschriebenen Funktionen auf ein bestehendes Peer-to-Peer System aufzusetzen. Eine konkretere Aufgabenbeschreibung ist im Antragstext zu finden. Wir sind allerdings auch für weitergehende Vorschläge, die sich von Seiten der PG Teilnehmer ergeben, grundsätzlich offen!
Da zur Erfüllung der gegebene Aufgabe verschiedene Kompetenzen benötigt werden, sollten die Teilnehmer entweder über Kenntnisse im Bereich der Verteilten Systeme oder im Bereich der Künstlichen Intelligenz, des Maschinellen Lernens bzw. der Wissensentdeckung in Datenbanken verfügen. In Einzelfällen kann auch eine andere, entsprechende Vorlesung anerkannt werden. Wenden Sie sich dazu am besten direkt an uns.
Das erste Treffen findet am 3.9.2004 um 10.00 Uhr in Raum 110, GB IV statt. Bei Fragen oder wenn es Schwierigkeiten mit diesem Termin gibt, wenden Sie sich bitte rechtzeitig an uns: wurst@ls8.cs.uni-dortmund.de
Die Folien der PG Vorstellung finden Sie hier: pg_vorstellung.ppt
Weitere Informationen zu dem System Yale finden Sie unter: http://yale.cs.uni-dortmund.de Das Plugin zur Verarbeitung von Audiodaten finden Sie unter Download/Plugins/ValueSeries. Dort liegen auch Beispieldateien.
Einige weitere interessante Links:
Eine vorläufige Liste von Seminarthemen jeweils mit Literaturreferenzen haben wir hier zusammengestellt.Die Aufteilung der Seminarthemen sieht folgendermaßen aus:
Thema | Vortragender |
Kollaborative Informationsagenten | Philip Thome |
Wissensmanagement und Künstliche Intelligenz | Andreas Kaspari |
Vorstellung und Vergleich von Agentensystemen und P2P Computing | Qing hua Fan |
Überblick: Konkrete, erweiterbare, Java basierte P2P/Agentensysteme | Matthias Lüttgens |
Datenaustausch und Koordinationsprotokolle in Agentensystemen | Said Chihani |
Algorithmen zur Verteilten Suche und zum Verteilten Indexieren | Maxim Martens |
(Hierarchische-) Klassifikation | Honorine Nguena-Sofak |
Clustering von Daten | Bülent Möller |
Überblick Multimediasuche/indexing | Metin Aksoy |
Extraktion von Merkmalen aus Audiodaten | Oliver Flasch |
Werkzeuge für die gemeinsame Softwareentwicklung | Umut Öztürk |
Softwareentwicklungsparadigmen und Vorgehensweisen | Dominique Burgard |
Ein Wikibasierter Webbereich zur Verwaltung von internen PG Dokumenten kann hier gefunden werden:
PG WikiDas Passwort und der Benutzername wird per mail bekanntgegeben.