Hauptnavigation

Seminar Wissensentdeckung - Entdeckungswissenschaft

Veranstalter: Prof. Dr. Katharina Morik
Vorkenntnisse: Voraussetzung für die Teilnahme ist die Vorlesung zur Künstlichen Intelligenz. Wünschenswert ist es, die Vorlesungen zu Informationssystemen und Maschinellem Lernen gehört zu haben.
Zeit: Dienstag, 14:15 - 16:00 Uhr
Ort: GB IV SR 113
Inhalt: Wissensentdeckung in Datenbanken (Knowledge Discovery in Databases, KDD) ist in den letzten Jahren zu einem Thema grössten Interesses seitens der Industrie geworden. Es geht darum, in den riesigen vorhandenen Datenbanken interessante Muster zu entdecken. Die Verallgemeinerung zur Entdeckungswissenschaft untersucht alle Datensammlungen (auch Freitext, WWW-Seiten, Daten aus gezielten Experimenten). 

In diesem Seminar soll ein detaillierter Einblick in die aktuelle Forschung in diesem Bereich gegeben werden. Dazu gehören einerseits die Methoden der Wissensentdeckung aus den Bereichen Statistik, Datenbanken und maschinellem Lernen. Zum anderen ermöglichen Praxisbeispiele aus Projekten des LS VIII den Einblick in ihre Einbettung und Anwendung. Ein zentrales Thema in Theorie und Praxis ist die Auswahl und Konstruktion von geeigneten Merkmalen für das Lernen. 

Literatur: Kann im Sekretariat (GB IV, Raum 116) abgeholt werden.

Seminarplan:

Termin Vortragender Stoff(Autor)
19.10. Morik Einführung
26.10. Morik Einführung
02.11. Morik Einführung
09.11. Schulz Pregibon et al, 1997 

Glymour, C., Madigan, David, Pregibon, D. and Smyth. P: 

Statistical Themes and Lessons for Data Mining 

In Fayyad, U. M., Mannila, H., and Piatetsky-Shapiro, G., editors: Data Mining and Knowledge Discovery, pages 11--28, Kluwer Academic Publ.

16.11. Schröter Gray et al., 1997 

Gray, J., Chaudhuri, S., Bosworth, A., Layman, A., Reichart, D., and Venkatrao, M. (1997). 

Data cube: A relational aggregation operator generalizing group-by, cross-tab, and sub-totals.  

Data Mining and Knowledge Discovery, 1(1):29 - 54. 

Folien zum Vortrag  (Stand 15.12.99, Postscript, 46.040 KB)  [Postscript (gz) 23.360 KB] [PDF 136 KB]

23.11. Koch Agrawal et al., 1996 

Agrawal, R., Mannila, H., Srikant, R., Toivonen, H., and Verkamo, A. I. (1996). 

Fast discovery of association rules. 

In Fayyad, U. M., Piatetsky-Shapiro, G., Smyth, P., and Uthurusamy, R., editors: Advances in Knowledge Discovery and Data Mining, AAAI Press Series in Computer Science, chapter 12, pages 277-296. A Bradford Book, The MIT Press, Cambridge Massachusetts, London England. 

Folien zum Vortrag  (Stand 14.02.2000, Postscript, 944 KB)  [Postscript (gz) 456 KB] [PDF 94 KB]

30.11. Stalitza Cooley et al., 1999 

Cooley, R., Mobasher, B. and Srivastava J. 

Data Preparation for Mining World Wide Web Browsing Patterns 

In Adam, N.R., Barnden J., A., and Zhong. N.: Knowledge and Information Systems chapter 1, pages 5 - 32 An International Journal, Springer. 

Folien zum Vortrag  (Stand 15.12.99, Postscript, 9.816 KB)  [Postscript (gz) 1.816 KB] [PDF 1.936 KB]

07.12. Kramer Kohavi, R. and John G.H., 1998 

The Wrappper Approach 

In Liu, H./Motada, H.: Feature Extraction Construction and Selection, A Data Mining Perspective chapter 3, pages S.33-48 Kluwer Academic Publishers Boston, Dordrecht, London. 

Folien zum Vortrag  (Stand 7.12.99, Postscript, 240 KB)  [Postscript (gz) 67 KB] [PDF 152 KB]

14.12. Kleefeld Grimmer, M., Mucha, H-J., 1998 

Datensegmentierung mittels Clusteranalyse 

In Nakhaeizadeh, editor: Data Mining pages 109-141 Beiträge zur Wirtschaftsinformatik 27 Physica-Verlag. 

Folien zum Vortrag  (Stand 15.12.99, Postscript, 1.376 KB)  [Postscript (gz) 448 KB] [PDF 312 KB]

11.01. Villwock Brazdil, P. and Gama, J., 1998 

Constructive Induction on Continuous Spaces 

In Liu, H./Motada, H.: Feature Extraction Construction and Selection, A Data Mining Perspective chapter 18, pages S.289-302 Kluwer Academic Publishers Boston, Dordrecht, London.

Folien zum Vortrag  (Stand 15.12.99, Postscript, 296 KB)  [Postscript (gz) 43 KB] [PDF 68 KB]

18.01. Münstermann Lopes, L. S. and Camarinha-Matos, 1998 

Feature Transformation Strategies for a Robot Learning Problem 

In Liu, H./Motada, H.: Feature Extraction Construction and Selection, A Data Mining Perspective chapter 23, pages S.375-391 Kluwer Academic Publishers Boston, Dordrecht, London.

Folien zum Vortrag  (Stand 27.12.99, Postscript, 13.768 KB)  [Postscript (gz) 224 KB] [PDF 208 KB]

25.01. Morik Dzeroski, S., 1996 

Inductive Logic Programming and Knowledge Discovery in Databases 

In Fayyad, U. M., Piatetsky-Shapiro, G., Smyth, P., and Uthurusamy, R., editors: Advances in Knowledge Discovery and Data Mining, AAAI Press Series in Computer Science, chapter 5, pages 117-152. A Bradford Book, The MIT Press, Cambridge Massachusetts, London England. 

Stahl, I., 1996 

Compression in Meassures in ILP DeRaedt measures 

In DeRaedt, editor: Advances in Inductive Logic Programming pages 295-306 IOS Press.

Folien zum Vortrag  (Stand 14.02.2000, Postscript, 47 KB)  [Postscript (gz) 18 KB] [PDF 10 KB]