Basismodul: Wissensentdeckung in Datenbanken (INF-MSc-235)

Veranstaltung	Wochentag	Termin	Ort
042519	Dienstag	10.15 - 12.00	HGII, HS4
042519	Donnerstag	14.15 - 16.00	HGII, HS4

Inhalt:

Die Vorlesung gibt einen Überblick über die Datenanalyse in großen Datenbanken. Der Prozess der Datenanalyse wird anhand des CRISP-Modells vorgestellt, eine Unterstützung der Vorverarbeitungs- und Lernschritte bietet das System Rapid Miner. Für die einzelnen Schritte des Datenanalyseprozesses werden jeweils typische Verfahren vermittelt. Die wichtigsten Verfahren der komplexen Datenanalyseverfahren aus Statistik oder Maschinellem Lernen werden vorgestellt. Als besonders wichtige Data Mining Methoden werden Klassifikations- und Clustering-Verfahren eingeführt, darunter die k-means-Methode, das Bestimmen von Entscheidungsbäumen, Assoziationsregeln und die Stützvektormethode. Einen Schwerpunkt bildet auch die Abschätzung der Glaubwürdigkeit der Ergebnisse mit Hilfe von geeigneten Testdesigns wie z.B. Kreuzvalidierung oder Bootstrapping. In den Übungen wird die Datenanalyse anhand von Daten aus der Praxis eingeübt. Interdisziplinäre Veranstaltung Diese Veranstaltung finden im interdisziplinären Rahmen zusammen mit dem Fachbereich Statistik statt.

Material

Vorlesungsmaterial finden Sie hier im Moodle-Raum.

Literatur:

Empfohlene Literatur wird in der Vorlesung bekannt gegeben, U.a.:

Hastie, T., Tibshirani, R., Friedman, J. (2001). The Elements of Statistical Learning. Springer.
Hand, D., Mannila, H., Smyth, P. (2001). Principles of Data Mining. MIT Press.
Witten, I.H., Frank, E. (2001): Data Mining Praktische Werkzeuge und Techniken für das maschinelle Lernen.
Mitchell, Tom (1997): Machine Learning, McGraw Hill, 1997

Hauptnavigation

General

Research

Teaching

Staff

Basismodul: Wissensentdeckung in Datenbanken (INF-MSc-235)

Inhalt:

Material

Literatur: