Hauptnavigation

Wissensentdeckung in Datenbanken

Die Vorlesung Wissensentdeckung in Datenbanken ist eine Einführung in die Datenanalyse sowohl aus Sicht der Statistik als auch der Informatik. Sie wird in diesem Jahr von Frau Prof. Dr. Katharina Morik (Informatik) und Herrn Prof. Dr. Claus Weihs (Statistik) gehalten.

Allgemeines

Auf dieser Seite stellen wir den Informatik-Teil der Vorlesung ohne Zugangsbeschränkung zur Verfügung. Die Folien zum Statistik-Teil findet man auf der folgenden Seite:

Die Einteilung der Teilnehmer auf die Gruppen kann hier eingesehen werden:

Die genauen Uhrzeiten und Modalitäten zu den Abgaben, dem Scheinerwerb und den Pool-Accounts könnt ihr dem folgenden Info-Blatt entnehmen:

Bei Fragen zur Vorlesung oder den Übungen helfen euch gerne die Übungsgruppenleiter weiter:

Dipl.-Stat. Julia Schiffner

Mathe-Tower, Raum M/740
Sprechstunde: Mo, 15 - 16 Uhr
www.statistik.tu-dortmund.de/schiffner.html

Dipl.-Inf. Klaus Friedrichs

Mathe-Tower, Raum M/920
Sprechstunde: Mo, 14 - 15 Uhr
www.statistik.tu-dortmund.de/friedrichs.html

Dr. Issam Ben Khediri

Mathe-Tower, Raum M/721
Sprechstunde: Do, 10 - 12 Uhr
www.statistik.tu-dortmund.de/khediri.html


Software

Die Übungsaufgaben erfordern teilweise den Einsatz der in der ersten Übung vorgestellten Softwarepakete R und RapidMiner.

Übungsblätter und Begleitmaterialien

Hier findet Ihr die Übungsblätter und dazugehörige Begleitmaterialien.

  • Blatt 1 - Ihre Lösungen zu diesem Blatt brauchen Sie nicht abgeben. Sie sollten sich aber unbedingt damit beschäftigen, um den Umgang mit RapidMiner zu lernen. Blatt 1 wird in der Übung am 20.04. besprochen.
  • Blatt 2 - Abgabe bis zum 25.04. an Klaus Friedrichs, Daten für Aufgabe 2.3
  • Blatt 3 - Abgabe bis zum 02.05., 10:00 Uhr per E-Mail an Julia Schiffner, Daten für die Bearbeitung der Aufgaben
  • Blatt 4 - Abgabe bis zum 09.05., 10:00 Uhr per E-Mail an Klaus Friedrichs, Daten für die Bearbeitung der Aufgaben
  • Blatt 5 - Abgabe bis zum 16.05., 10:00 Uhr per E-Mail an Julia Schiffner und/oder in Briefkasten 146 im Mathe-Foyer
  • Blatt 6 - Abgabe bis zum 23.05., 10:00 Uhr per E-Mail an Julia Schiffner und/oder in Briefkasten 146 im Mathe-Foyer, Daten für die Bearbeitung der Aufgaben
  • Blatt 7 - Abgabe bis zum 30.05., 10:00 Uhr per E-Mail an Issam Ben Khediri und/oder in Briefkasten 146 im Mathe-Foyer, Date1 und Sim1 für die Bearbeitung der Aufgaben
  • Blatt 8 - Abgabe bis zum 06.06., 10:00 Uhr per E-Mail an Issam Ben Khediri und/oder in Briefkasten 146 im Mathe-Foyer, Daten für die Bearbeitung der Aufgaben
  • Blatt 9 - Abgabe bis zum 13.06., 10:00 Uhr per E-Mail an Klaus Friedrichs und/oder in Briefkasten 146 im Mathe-Foyer, Daten für die Bearbeitung der Aufgaben
  • Blatt 10 - Abgabe bis zum 20.06., 10:00 Uhr per E-Mail an Julia Schiffner und/oder in Briefkasten 146 im Mathe-Foyer, Daten für die Bearbeitung der Aufgaben
  • Blatt 11 - Abgabe bis zum 27.06., 10:00 Uhr per E-Mail an Klaus Friedrichs und/oder in Briefkasten 146 im Mathe-Foyer
  • Blatt 12 - Abgabe bis zum 04.07., 10:00 Uhr per E-Mail an Klaus Friedrichs und/oder in Briefkasten 146 im Mathe-Foyer
  • Blatt 13 - Abgabe bis zum 11.07., 10:00 Uhr per E-Mail an Issam Ben Khediri und/oder Briefkasten 146 im Mathe-Foyer Daten für die Bearbeitung der Aufgaben

Vorlesungsinhalte

Nachfolgend findet ihr während der Vorlesung eine laufend aktualisierte Liste der Vorlesungsinhalte für den Informatik-Teil. Die Auflistung garantiert keine Vollständigkeit und ist nicht als Grundlage für Prüfungsvorbereitungen, sondern lediglich als Erinnerung/Überblick zu verstehen.

Datum Folien
03.04.2012 Motivation zum Thema Wissenentdeckung in Datenbanken
Überblick über Einsatzfelder von Data Mining und Statistik
Statistik-Grundlagen
Inhalte und Zeitplan der Vorlesung
1DMVintro.pdf
05.04.2012 Modellbildung und Evaluation
CRISP
EinfÜhrung in RapidMiner
2DMVCRISP.pdf
10.04.2012 Data Cube 3DMVfreq1DataCube.pdf
12.04.2012 Apriori
FP-Tree
3DMVfreq2AprioriEtc.pdf
15.05.2012 Lineare Modelle
Bias
4biasVarianceMLV.de.pdf
22.05.2012 SVM Grundlagen
Maximum Margin Methode
Lagrange-Optimierung
Weich trennende SVM
5SVM1.pdf
24.05.2012 Lösung des Optimierungsproblems
SMO und Kernfunktionen
5SVM2.pdf
29.05.2012 Information Retrieval
Textklassifikation
5SVM3.pdf
31.05.2012 Strukturelle Modelle - SVMstruct 5SVMstruct.pdf
21.06.2012 Cluster-Analyse
K-Means
Hierarchisches Clustering
7DMVcluster.pdf
26.06.2012 Organisation von Sammlungen
LACE
Musik als Daten
7DMVlace.pdf