Übung Data Warehousing and Data Mining
Die Übung begleitet den Halbkurs Data Warehousing und Data Mining.
Repetitorium
Die Repetitoriumsfolien findet ihr hier
News
- Einen Überblick über die nächsten Termine (und deren Stattfinden) findet ihr hier.
- Eine Liste der teilnehmenden Gruppen und den Status eurer Übungslösungen findet ihr hier.
Ablauf
Die Übung wird in Gruppen á 2-3 Personen durchgeführt. Jede Übungsgruppe muss 6 Aufgabenblätter bearbeiten. Für die Bearbeitung stehen jeweils 2-3 Wochen zur Verfügung. Der Ablauf wird sich so gestalten, dass an einem Termin jeweils die neue Aufgabe gestellt und die Lösungen der alten Aufgabe besprochen werden. Dabei stellt jede Gruppe ihre Lösung kurz vor. Die Termine, an denen keine neuen Aufgaben gestellt werden, sind offene Frage- bzw. Diskussionsstunden.
Wöchentliche Übungstermine
- Montag 11:00-13:00 Uhr (RUD 26, 0.313)
- Donnerstag 09:00-11:00 Uhr (RUD 25, 4.113)
- Donnerstag 13:00-15:00 Uhr (RUD 26, 1'306)
Pflichttermine
Die Anwesenheit ist an folgenden Terminen (ohne Ausnahme!) Pflicht:
- 07. bzw. 10. November 2011 (Präsentation 1. Aufgabe)
- 21. bzw. 24. November 2011 (Präsentation 2. Aufgabe)
- 05. bzw. 08. Dezember 2011 (Präsentation 3. Aufgabe)
- 02. bzw. 05. Januar 2012 (Präsentation 4. Aufgabe)
- 23. bzw. 26. Januar 2012 (Präsentation 5. Aufgabe)
- 13. bzw. 16. Februar 2012 (Präsentation 6. Aufgabe, Siegerehrung)
Alle anderen Termine sind fakultativ. Aufgrund der Anzahl der Termine bitte ich euch, mir spätestens am Tag vor dem freiwilligen Termin ein Mail zu schicken, falls jemand von euch plant teilzunehmen! Falls ich kein Mail bekomme, werde ich an den freiwilligen Terminen nicht anwesend sein.
Übungsaufgaben
- Organisatorisches (Folien)
- Beispiel-Javacode (Source)
- Aufgabenblatt 1: PL/SQL (Deadline: 06. November 2011)
-
Aufgabenblatt 2: Große Datenmengen (Deadline: 20. November 2011)
- Eingabedatei 1(Achtung: ca. 630 MByte)
- Eingabedatei 2(Achtung: ca. 630 MByte)
- Join Strategien - Kurzüberblick
- Aufgabenblatt 3: Modellierung und Oracle(Deadline: 04. Dezember 2011), Beispieldaten
- Aufgabenblatt 4: Indizierung mit Oracle(Deadline: 01. Januar 2012), CREATE Skript, Skript für die Zeitmessung
- Aufgabenblatt 5: Effiziente Anfragebearbeitung (Deadline: 22./24. Januar 2012), CREATE Skript, Testdaten
- Aufgabenblatt 6: Materialisierte Sichten (Deadline: 13./16. Februar 2012), Übersicht, Skript zum Anlegen des TPC-H-Schema, Zeitmessung, Größenmessung, Anfragen
Weitere Informationen
-
Einige Tools für den Umgang mit Oracle
-
Aqua Data Studio: www.aquafold.com
Query Analyzer, Scheme & Script Browser, Table Editor, Query Results Viewer.
Erhältlich für Linux, Windows, MacOS X, Solaris, Java. Benötigt keinen Oracle Client. -
SQL-Tools: www.sqltools.net
Graphisches Explain Plan, Object View, PL/SQL Editor, Syntax Highlighting, etc.
Nur Windows, man braucht eine Oracle Client Installation. -
TORA: tora.sourceforge.net/
Tool für Windows & Linux.
Benötigt den Oracle Client. -
TOAD: www.toadsoft.com/downld.html Sehr mäöchtiges kommerzielles Tool. Erhältlich auch in einer (begrenzten) FreeWare-Version.
Nur Windows, benötigt den Oracle Client. - DB Designer 4: fabforce.net/dbdesigner4/ Graphische Modellierung, Oracle-Unterstützung. Für Windows und Linux
-
Aqua Data Studio: www.aquafold.com
- Oracle Technology Network (Registrierung erforderlich)