Hauptnavigation

Grundlagen der Datenwissenschaften

Veranstaltung Wochentag Termin Ort
Vorlesung Donnerstag 14.15 - 16.00 OH 14, Raum 104 ,
Campus Nord
Übung Donnerstag 16.15 - 18.00 OH 14, Raum 104 ,
Campus Nord

Moodle-Anmeldung:

Materialien und Übungsaufgaben werden im Moodle zur Verfügung gestellt.

Inhalt:

Die Verarbeitung von Daten stellt im Zeitalter von „Big Data“ neue Herausforderungen an die Informatik. Anfragen an Datenbanken werden immer komplexer und benötigen Ansätze des Maschinellen Lernens und des Data Minings, und die Größe der Datenmengen stellt neue algorithmische Herausforderung an diese Techniken. Die Vorlesung soll die Grundlagen moderner Ansätze zur Verarbeitung von Daten und zum Extrahieren von Wissen aus ihnen abdecken. Das umfasst Fragestellungen zu Datenbankmanagementsystemen wie z.B. Datenbanken, Anfragesprachen, verteilte Dateisysteme, Map-Reduce und Datenstrommodelle als Hilfsmittel um Algorithmen zu entwerfen, die mit großen Datenmengen umgehen können. Dann soll anhand der Nächste-Nachbarn-Klassifikation Techniken zur Änlichkeitssuche wie z.B. minhash, locality-sensitive Hashing und spektrales Hashing angesprochen werden. Danach sollen weitere Basistechniken des Maschinellen Lernens und des Data Minings erläutert werden wie z.B. naive Bayes, Entscheidungsbäume, Stützvektormaschienen, die Clusteranalyse und das Finden von häufigen Teilmengen. Abschliessen sollen die Grundlagen von Suchmaschinen vermittelt werden wie z.B. Googles PageRank und Kleinbergs Hypertext-induced Topic Selection zur Berechnung von Hubs und Authorities.