Data Warehousing and Data Mining
Dozent: Dr. Patrick Schäfer
Mit Data Warehouses (DWH) werden sehr große, integrierte und auf die Datenanalyse ausgerichtete Datenbanken bezeichnet. Die Vorlesung behandelt diese Thematik in zwei Blöcken. Im ersten Block werden Methoden zum Aufbau und Management von DWH in relationalen Datenbanken vorgestellt (Architekturen, ETL-Prozess, das multidimensionale Datenmodell, OLAP Operationen, Bitmap-Indexe, materialisierte Sichten etc.). Im zweiten Block besprechen wir Algorithmen, die auf den gesammelten Daten Analysen vornehmen (Data Mining), insbesondere Klassifikation, Clustering und Association-Rule Mining. Der Schwerpunkt liegt auf der performanten Implementierung solcher Algorithmen in Datenbanken. In der vorlesungsbegleitende Übung werden ausgewählte Verfahren anhand eines aktuellen kommerziellen RDBMS erprobt.
Termine
Der Termin der ersten Vorlesung ist Dienstag, der 22.10.24. Die Zugangsdaten zu Moodle werden in der Übung kommuniziert.
Da der Kurs vollständig überbucht ist und erfahrungsgemäß nicht alle Teilnehmenden erscheinen, die über Agnes einen Platz erhalten haben, ist die Teilnahme an der ersten Übung am Dienstag, den 22. Oktober, bzw. Freitag, den 25. Oktober, verpflichtend. Nur wer an einem der beiden ersten Übungstermine erscheint, hat seinen Platz sicher oder kann noch einen bekommen. Dabei ist egal, an welchem Termin ihr kommt.
Dienstag | 11:00 - 13:00 | Hörsaal 0'110 (RUD26) |
Freitag | 11:00 - 13:00 | Hörsaal 0'110 (RUD26 |
Anmeldung
Die Anmeldung erfolgt über AGNES.
Voraussetzungen
Voraussetzung für den Besuch sind gute Kenntnisse in relationalen Datenbanken (z.B. Modul Einführung in Datenbanksysteme).
Prüfungen
Die Vorlesung wird mit einer Klausur abgeschlossen.
Die Vorlesung ist anrechenbar für
- Diplomstudiengang Informatik, Halbkurs praktischen Informatik, 8SP
- Master Informatik, Vertiefung Daten- und Wissensmanagement, 10SP
- Master Wirtschaftsinformatik, 10SP
Voraussetzung für die Zulassung zur Prüfung ist das Bestehen der Übung.
Themen und Folien
Folien sind in Moodle jeweils nach der Vorlesung als PDF verfügbar. Änderungen möglich.
Literatur
- Kelleher, J., Mac Namee, B. and A'Arcy, A. (2015). "Foundations of Machine Learning for Predictive Analysis", MIT Press.
- Lehner, W. (2003): "Datenbanktechnologie für Data Warehouse Systeme", dpunkt.verlag
- Bauer/Günzel: Data Warehouse Systeme, dpunkt.verlag, 2008
- Han/Kamber: Data Mining, Morgan Kaufmann, 2006
- Jensen, Pedersen, Thomsen: Multidimensional Databases and Data Warehousing, Morgan&Claypool, Synthesis Lectures, 2010