Übung zu Data Warehousing and Data Mining
Dozent: Patrick Schäfer
Die Übung begleitet die Vorlesung Data Warehousing und Data Mining.
Die Termine für die erste Übung sind am 23. Oktober (Gruppe 1) bzw. 25. Oktober (Gruppe 2). Der Termin ist Pflicht für alle Teilnehmer. Es werden Arbeitsgruppen gebildet und die erste Aufgabe erläutert.Termine
Gruppe 1 | Montag | 13:00 - 15:00 | RUD 26, 1'306 |
Gruppe 2 | Mittwoch | 13:00 - 15:00 | RUD 26, 1'306 |
Ablauf
In der Übung werden werden ausgewählte Verfahren anhand eines aktuellen kommerziellen RDBMS (Oracle) erprobt. Die Arbeit erfolgt in Gruppen a zwei bis drei Studierenden. Insgesamt wird es fünf Aufgaben geben; jede Gruppe muss alle bis auf eine erfolgreich bearbeitet haben. Die Aufgaben werden an einem Übungstermin ausgegeben, und die Lösungen müssen meist drei Wochen später von einem der Gruppenmitglieder im Rahmen eines kurzen Vortrags dargestellt werden. In dem Vortrag geht es vor allem darum, gesammelte Erfahrungen an zu kommunizieren.
Die Termine, an denen keine neuen Aufgaben gestellt werden, sind offene Frage- bzw. Diskussionsstunden.
Wettbewerb (freiwillig)
Die Übungsaufgaben sind als Wettbewerb gestaltet. Das heißt, dass die Aufgaben verschieden gut gelöst werden können (schnellere Implementierung, bessere Qualität etc.). Pro Aufgabe erhalten die drei besten Gruppen Punkte, und am Ende wird ein Gesamtsieger gekürt. Die Teilnahme an dem Wettbewerb ist freiwillig.
Die einzelnen Aufgaben und Termine
Diese Liste wird ständig aktualisiert. Folien zu den Aufgaben und notwendige Daten werden hier veröffentlicht.
- 23., 25.10.: Pflichttermin: Einführung, Gruppenbildung, 1. Aufgabe
- 13., 15.11.: 2. Aufgabe & 1. Kurzvorträge
- 27., 29.11.: 3. Aufgabe & 2. Kurzvorträge
- 18., 20.12.: 4. Aufgabe & 3. Kurzvorträge
- 22., 24.01.: 5. Aufgabe & 4. Kurzvorträge
- 12., 14.02.: Abschluss & 5. Kurzvorträge
Übungsaufgaben
- Intro
- Aufgabenblatt 1 (updated FAQ) - Abgabe: 08.11.17, 23:59 Uhr
- Eingabedatei 1(Achtung: ca. 630 MByte)
- Eingabedatei 2(Achtung: ca. 630 MByte)
- Join-Strategien
- Auswertung
- Aufgabenblatt 2 - Abgabe: 24.11.17, 23:59 Uhr
- Mitarbeiterliste (updated: 14.11. Duplikate entfernt)
- Oracle Intro
- Auswertung
- Korrektur-Kommentare
- Aufgabenblatt 3 - Abgabe: 13.12.17, 23:59 Uhr
- Aufgabenblatt 4 - Abgabe: 17.01.18, 23:59 Uhr (updated: 15.01. Vorrechnen hinzugefügt)
- Oracle Indexing Primer
- Einwohner/Tabelle/Zeitmessung(updated: 8.1. 10.000 hinzugefügt)
- Auswertung
- Korrektur-Kommentare
- Aufgabenblatt 5 - Abgabe: 07.02.18, 23:59 Uhr
Weitere Informationen
- Dokumentation von Oracle
- Einige Tools für den Umgang mit Oracle
- Oracle Technology Network (Bitte registrieren)
- Oracle Instant Client Libraries: Oracle APIs für verschiedene Sprachen, inklusive Node.js, Python, PHP, OCI, OCCI, JDBC, ODBC
- Oracle SQL Developer: Für Windows, Mac und Linux
- Oracle Database 11g Express Edition: Lokale Oracle DB Installation zum Entwickeln
- DBWeaver: Tool für Windows, MacOS X & Linux. Auch als Eclipse Plugin verfügbar. Benötigt den Oracle Instant Client (s.o.).
- Aqua Data Studio: Query Analyzer, Scheme & Script Browser, Table Editor, Query Results Viewer. Erhältlich für Linux, Windows, MacOS X, Solaris, Java. Benötigt den Oracle Instant Client (s.o.).
- SQL-Tools: Graphisches Explain Plan, Object View, PL/SQL Editor, Syntax Highlighting, etc. Nur Windows, man braucht den Oracle Instant Client (s.o.).
- TOAD: Sehr mächtiges kommerzielles Tool. Erhältlich auch in einer (begrenzten) FreeWare-Version. Nur Windows, benötigt den Oracle Instant Client (s.o.).
- TORA: Tool für Windows & Linux. Benötigt den Oracle Instant Client (s.o.).
- DB Designer 4: Graphische Modellierung. Für Windows und Linux