Die Vorlesung Wissenentdeckung in Datenbanken ist eine Einführung in die Datenanalyse sowohl aus Sicht der Statistik als auch der Informatik. Sie wird in diesem Jahr von Herrn JProf. Dr. Uwe Ligges (Statistik) und Frau Prof. Dr. Katharina Morik (Informatik) gehalten.
Alle Informationen zur Vorlesung und zum Übungsbetrieb findet ihr grundsätzlich auf der Seite der Statistiker:
Für den Zugang benötigt ihr einen Benutzernamen und ein Kennwort, welche in der Vorlesung bzw. den Übungen bekannt gegeben werden. Auf der Seite, auf der ihr euch gerade befindet, stellen wir den Informatik-Teil der Vorlesung ohne Zugangsbeschränkung zur Verfügung.
Aktuelle Termine für diese Veranstaltung sind:
Die Anmeldung zu den Übungen erfolgte in der ersten Vorlesung. Die Aufteilung der Teilnehmer auf die Gruppen kann hier eingesehen werden:
Die genauen Uhrzeiten und Modalitäten zu den Abgaben, dem Scheinerwerb und den Pool-Accounts könnt ihr dem folgenden Info-Blatt entnehmen:
Bei Fragen zur Vorlesung oder den Übungen helfen euch - je nach Schwerpunkt - gerne die Übungsgruppenleiter weiter:
Die Übungsaufgaben erfordern teilweise den Einsatz der in der ersten Übung vorgestellten Softwarepakete R und RapidMiner.
Hier findet Ihr die Übungsblätter und dazugehörige Begleitmaterialien (z. B. Datensätze).
Nachfolgend findet ihr während der Vorlesung eine laufend aktualisierte Liste der Vorlesungsinhalte für den Informatik-Teil. Die Auflistung garantiert keine Vollständigkeit und ist nicht als Grundlage für Prüfungsvorbereitungen, sondern lediglich als Erinnerung/Überblick zu verstehen.
13.04.2010 |
Motivation zum Thema Wissenentdeckung in Datenbanken Überblick über Einsatzfelder von Data Mining und Statistik Statistik-Grundlagen Inhalte und Zeitplan der Vorlesung |
Folien: 1DMVintro.pdf |
22.04.2010 |
DataCube, Apriori und FPgrowth |
Folien: DataCube Folien Apriori und FPgrowth Folien |
27.04.2010 |
MinEx LTree |
Folien: MinEx Folien LTree Folien |
29.04.2010 |
Frequent Itemsets über Datenströmen Online-Algorithmen |
Folien: Hierarchical Heavy Hitters Folien |
06.05.2010 |
Lineare Modelle Bias Variance |
Folien: Folien zu linearen Modellen und bias/variance |
11.05.2010 |
kNN |
Folien: Folien zu kNN |
25.05.2010 |
Additive Modelle |
Folien: Folien zu additiven Modellen |
10.06.2010 |
Support Vector Machine |
Folien: Folien zur SVM 1/2 |
15.06.2010 |
Support Vector Machine, SMO |
Folien: Folien zur SVM 2/2 |
22.06.2010 |
Structural Support Vector Machine |
Folien: Folien zur SVMstruct |
2010 |
Text-Mining (wurde in der Vorlesung nicht behandelt) |
Folien: Folien zu Textmining |
13.07.2010 |
Cluster-Analyse |
Folien: Folien zu Clustering |
15.07.2010 |
Verteiltes Clustering |
Folien: Folien zu verteiltem Clustering |
Seitenentwurf und Grafik von Christian Bockermann