Description |
Die Internet Movie Database ist eine öffentliche Datenbank, die für zahlreiche Filme deren Produzenten, Schauspieler und viele weitere Informationen enthält. Verschiedene Benutzer greifen auf dieselbe Datenbank mit unterschiedlichen Zielen zu: Schauspieler, Regisseure, Filmförderer, Beleuchter, Drehbuchautoren. Sie stellen Fragen wie:
Was charakterisiert europäische Kassenschlager? Welche Beleuchter können mit Kerzenlicht umgehen? Welche Filme werden von Frauen hoch, von Männern niedrig bewertet? Welche Schauspieler kommen nur in schlecht bewerteten Filmen vor?
Solche Fragen können nicht durch einfache Anfragen beantwortet werden, sondern erfordern maschinelles Lernen (z.B. zur Subgruppenentdeckung). Damit dies anwendbar wird, werden die Daten vorverarbeitet. Es ergibt sich eine Kette von Operatoren (Data Mining Kette).
Ziel der Diplomarbeit ist es, effiziente und valide Data Mining Ketten für unterschiedliche Personengruppen zu entwickeln und festzustellen, welche Lernverfahren sich für welche Fragestellungen am besten eignen.
Das MiningMart System steht als Modellierungstool zur Verfügung, es können aber auch eigene Komponenten entwickelt und Operatoren hinzugefügt werden. |