Hauptnavigation

Maschinelles Lernen

Prof. Dr. Katharina Morik

Die Vorlesung Maschinelles Lernen ist eine Einführung in das Gebiet der künstlichen Intelligenz und behandelt neben einem Überblick über das Gebiet sowohl die theoretischen Grundlagen als auch eine Reihe praktischer Umsetzungen. Dabei bieten insbesondere die Übungen die Möglichkeit, die vorgestellten Algorithmen in einer flexiblen Umgebung zu implementieren und auf einer Reihe von (eigenen?) Daten auszuprobieren.

Auf dieser Seite findet ihr einige Infos zur Vorlesung und zur Übung. Die genauen Modalitäten zu den Abgaben, dem Scheinerwerb und weiteren Details könnt ihr dem Info-Blatt entnehmen. Bei Fragen zur Vorlesung oder den Übungen helfen wir euch gerne weiter. Ihr erreicht uns hier:

Vorlesung Übungen
Prof. Dr. Katharina Morik
Campus Süd, GB IV, Raum 115
katharina.morik (at) cs.uni-dortmund.de
Dipl.-Inf. Christian Bockermann
Campus Süd, GB IV, Raum 119
christian.bockermann (at) cs.uni-dortmund.de

Übungen

Die Übungen teilen sich in ein Übungsblatt und ggf. zusätzliche Java-Klassen und Interfaces auf. Die Java-Sourcen könnt ihr über ein zentrales SVN-Repository erreichen, welches im Verlauf der Vorlesung stetig um weitere Übungsklassen und Interfaces ergänzt wird.

Nähere Informationen dazu findet ihr auf dem bereits angesprochenen Info-Blatt.

Hot Topics

Übungsblätter

Im Folgenden findet ihr die Übungsblätter und ggf. zusätzliche Materialien zur Vorlesung bzw. Übung.

Aktueller Punktestand

Die folgende Liste enthält die erreichten Punkte:
+-------------+--------+---------+
| matrikel-nr | punkte | prozent |
+-------------+--------+---------+
|       87343 | 116.00 | 89.23   | 
|       90205 | 113.00 | 86.92   | 
|       91233 | 10.00  | 7.69    | 
|       93593 | 104.00 | 80.00   | 
|       96065 | 62.00  | 47.69   | 
|       96897 | 26.00  | 20.00   | 
|       98857 | 113.00 | 86.92   | 
|      100399 | 108.50 | 83.46   | 
|      100551 | 108.00 | 83.08   | 
|      100960 | 110.00 | 84.62   | 
|      100994 | 108.00 | 83.08   | 
|      103556 | 62.00  | 47.69   | 
|      104931 | 62.00  | 47.69   | 
|      108239 | 108.50 | 83.46   | 
|      109421 | 116.00 | 89.23   | 
|      109686 | 105.00 | 80.77   | 
|      110614 | 10.00  | 7.69    | 
|      111278 | 116.00 | 89.23   | 
|      111451 | 105.00 | 80.77   | 
|      113448 | 110.00 | 84.62   | 
|      118198 | 104.00 | 80.00   | 
|      122865 | 26.00  | 20.00   | 
|      126288 | 113.00 | 86.92   | 
+-------------+--------+---------+
23 rows in set (0.00 sec)
Angaben ohne Gewähr.
Sollte jemand Unstimmigkeiten bezüglich seiner Punktezahl finden, möge er sich bitte bei mir melden!

Software

Die in den Übungen zur Vorlesung verwendete Software ist im Internet frei verfügbar, so dass sämtliche Übungen auch zu Hause durchgeführt werden können. Die Software findet sich leicht über folgende Links:

Vorlesungsinhalte

Nachfolgend findet ihr während der Vorlesung eine laufend aktualisierte Liste der Vorlesungsinhalte. Die Auflistung garantiert keine Vollständigkeit und ist nicht als Grundlage für Prüfungsvorbereitungen sondern lediglich als Erinnerung/Überblick zu verstehen.

NEU: Die Folien sind nun auch als Vorlesungsskript verfügbar.

14.10.2008 Motivation für maschinelles Lernen, Anwendungen
Lernen beim Menschen
Überblick über Lernaufgaben, Validierung, Kreuzvalidierung
Folien:
[Präsentation] [Druckversion Druckversion 4-auf-1]
21.10.2008 Lineare Modelle, Anpassung über Trainingsfehler
Dekomposition in Bias Varianz
Folien:
[Druckversion] [Druckversion 4-auf-1]
28.10.2008 Globale -> lokale Modelle, k-nächste Nachbarn
Modellselektion mit Kreuzvalidierung, Bayesche Statistik und das BIC-Kriterium
Folien:
[Druckversion] [Druckversion 4-auf-1]
04.11.2008 Modellselektion über Maximum Likelihood
Minimum Description Length, Baumlerner ID3
Folien:
[Druckversion] [Druckversion 4-auf-1]
11.11.2008 Baumlerner (Fortsetzung), Konfidenzintervalle, Z-Transformation
Gütemaße (Accuracy, Recall, F-Measure), Lift&ROC
Funktionsapproximation mit natürlichen kubischen Splines
Folien:
Siehe Folien vom 04.11.2008.
18.11.2008 Support Vector Machine, Maximum Margin Problem
Optimierung unter Nebenbedingungen nach Lagrange
Relaxation -> weich trennenden Hyperebenen
Folien:
[Druckversion] [Druckversion 4-auf-1]
25.11.2008 Folien:
[Druckversion] [Druckversion 4-auf-1]
02.12.2008 Strukturelle Risikominimierung, VC-Dimension Folien:
[Druckversion] [Druckversion 4-auf-1]
09.12.2008 Text-Klassifikation, Information-Retrieval,
TFIDF, TCat-Modell
Folien:
[Druckversion] [Druckversion 4-auf-1]
16.12.2008 SVMstruct Folien:
[Druckversion] [Druckversion 4-auf-1]
06.01.2009 Clustering, Ähnlichkeit und Distanzmaße, Optimierungsproblem
k-Meansm, Heuristiken zur Bestimmung von k und Anfangspunkten
Hierarchisches Clustering
Folien:
[Druckversion] [Druckversion 4-auf-1]
13.01.2009 Tag-Sammlungen (Folksonomies), Cluster Ensembles (nach Topchy),
Localized Alternative Clustering of Ensembles (LACE)
Hierarchisches Clustering, Konsensusmodelle
Folien:
[Druckversion] [Druckversion 4-auf-1]
20.01.2009 Merkmalsextraktion aus Musik-Daten,
Merkmalserzeugung mittels Genetischer Programmierung,
Merkmalstransfer
Folien:
[Druckversion] [Druckversion 4-auf-1]
(Fortsetzung der vorherigen Vorlesung/des vorherigen Foliensatzes)

Vorlesungsskript

Die Folien wurde erweitert und zu einem Vorlesungsskript zusammengefasst.