Fachprojekt:
Data-Mining und Datenanalyse (INF-BSc-269)
Veranstaltung |
Wochentag |
Termin |
Ort |
040269 |
Montag |
12:00 - 13:45 Uhr |
MSW16, Raum E29 Campus Nord |
040269 |
Mittwoch |
14:15 - 16:00 Uhr |
OH14, Raum 104 Campus Nord |
Inhalt
Täglich produzieren wir Unmengen an Daten - beim Einkauf, beim Surfen im Web, beim Autofahren oder Telefonieren. All diese Daten ergeben jedoch erst einen "Sinn", wenn wir sie mit geeigneten Verfahren analysieren und auswerten können.
Sind die zu analysierenden Daten oder die Komplexität der betrachteten Verfahren zu groß, können einzelne Analysen Tage, Wochen oder sogar Monate an Berechnungszeit in Anspruch nehmen.
Eine mögliche Herangehensweise ist die Hardwarebeschleunigung der entsprechenden Algorithmen mit Hilfe programmierbarer Grafikprozessoren (GPU).
Dies ist allerdings nur dann möglich, wenn das zugrunde liegende Problem bestimmte Voraussetzungen erfüllt, nämlich einen ausreichend hohen Grad an Datenparallelität aufweist.
Ziel dieses Fachprojektes ist es, dass die Studierenden nach einer erfolgreichen Teilnahme
- erkennen können in welchen Fällen die Parallelisierung einer Datenanalyse möglich ist
- selbstständig parallele Algorithmen nachvollziehen und formulieren können,
- parallele Algorithmen für GPUs implementieren können.
Nach einer dreiwöchigen Einführung in die parallele Programmierung, findet eine sechswöchige Seminarphase statt, in der die Teilnehmer relevante Themen der parallelen Datenverarbeitung ausarbeiten und präsentieren.
Abschließend werden die Studierenden in einer Projektphase eigene GPU Implementierungen
entwickeln, vorstellen sowie die Vor- und Nachteile der einzelnen Lösungen diskutieren.
Aktuelles
- Nächster Termin: Vorraussichtlich WS2014/2015
- Nächstes Treffen: Montag, 8. Juli 2013, 12:00Uhr
- Verlängerung der Deadline für Implementierung und Ausarbeitung auf Montag, 8. Juli 2013, 10:00Uhr, per SVN.
- Die Einführung in GNUPlot findet am Montag, 10 Juni 2013, 12:15Uhr statt.
- Abgabe von Implementierung und Ausarbeitung bis Montag, 1. Juli 2013, 10:00Uhr, per SVN.
- Abgabe der dritten Aufgabe bis Mittwoch, 15. Mai 2013, 10:00Uhr, per SVN.
- Am Montag, 22. April 2013 werden Fragen zur
aktuellen Aufgabe besprochen. Bitte melden Sie Ihre Fragen vorab
per E-Mail
an.
- Abgabe der zweiten Aufgabe bis Mittwoch, 24. April 2013, 10:00
Uhr, per SVN.
- Montags beginnt die Veranstaltung nun bereits um 12:00 Uhr!
- Abgabe der ersten Aufgabe bis Montag, 15. April 2013, 11:00 Uhr,
per
SVN.
- Start der Veranstaltung: Montag, 08. April 2013, MSW16,
E29
Downloads
Literatur
- Joseph JáJá, An introduction to parallel algorithms, Addison Wesley Longman Publishing Co., Inc., Redwood City, CA, USA, 1992.
- Bjarne Stroustrup, Die C++ Programmiersprache, 4 ed., Addison Wesley, München, Germany, 2000.
- David R. Butenhof, Programming with POSIX Threads, Addison-Wesley Professional, May 1997.
- T. Hastie, R. Tibshirani, and J. H. Friedman, The elements of statistical learning, corrected ed., Springer, Jan 2013.
- nVidia Corporation,
CUDA Toolkit Documentation, 2012.
- pymf - Python Matrix Factorization Module
- SVMlight - Support Vector Machine