Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Masterseminar: Algorithmen und Methoden der Zeitreihenanalyse - Detailseite

Dr. Patrick Schäfer

Eine Zeitreihe stellt eine Folge zetlich geordneter Messungen dar, wie z.B. EKG-Verläufe, Aktienkurse oder Sensormessungen. Die Zeitreihenanalyse umfasst Methoden zur Analyse dieser Daten, aufgeteilt in Vorhersage, Klassifikation, Anomalie-Erkennung, Segmentierung, Motif-Erkennung oder Clusterung.

In diesem Seminar werden wir uns mit dem Aspekt der Motif-Erkennung auf Zeitreihen beschäftigen. Motifs einer Zeitreihe sind kurze, sich häufig wiederholende Teilsequenzen.

Die Literatur enthält verschiedenste Definitionen von Motif-Paaren bis Motif-Mengen und effiziente Algorithmen zur Berechnung von selbigen.

Termin der Einführungsveranstaltung: Fr 5.11. RUD 25, Raum 4.112, 13 bis 15 Uhr

Beispiel für gefundene Motif-Paare und Motif-Mengen in einer periodischen Zeitreihe über den Zeitraum von Jan '95 - Jan '96 in Italien. Die abgebildeten Motifs umfassen jeweils den Zeitraum einer Woche und häufen sich Anfang und Ende eines Jahres. Die Sommermonate weisen einen deutlich geringeren Stromverbrauch auf als die Wintermonate (Stromverbrauch durch Heizen).

motifs.png

Ablauf

Gruppen von Studierenden werden jeweils einen in der Literatur beschriebenen Ansatz in Vortrag und Ausarbeitung darstellen, sowie diesen auf echten Zeitreihendaten anwenden. Das Seminar hat das übergeordnete Ziel, die Eigenheiten der verschiedenen Motif-Definitionen kennenzulernen und deren Eigenheiten vergleichen zu können.

Das Seminar findet im wesentlichen als Blockseminar am Ende des Semesters statt. Vorher sind Einführungstermin(e) und individuelle Themenbesprechungen zu besuchen. Die Themen können jeweils ein bis zwei Studierende bearbeiten.

Es wird die Möglichkeit bestehen, aufbauend auf dem Seminar, eine Abschlussarbeit an unserem Lehrstuhl zu dem Thema zu bearbeiten.

Einführende Literatur

  1. Esling, Philippe, and Carlos Agon. "Time-series data mining." ACM Computing Surveys (CSUR) 45.1 (2012): 1-34. LINK
  2. Finding Repeated Structure in Time Series: Algorithms and Applications. (Präsentation) LINK
  3. https://scholar.google.de for searching scientific papers
  4. Mueen, Abdullah. "Time series motif discovery: dimensions and applications." Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 4.2 (2014): 152-159. (Paywall, siehe Moodle)
  5. Truong, Cao Duy, and Duong Tuan Anh. "A survey on time series motif discovery." International Journal of Business Intelligence and Data Mining 15.2 (2019): 204-227. (Paywall, siehe Moodle)
  6. Torkamani, Sahar, and Volker Lohweg. "Survey on time series motif discovery." Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery 7.2 (2017): e1199. (Paywall, siehe Moodle)

Voraussetzungen

  • Gute Kenntnisse in Algorithmen und Datenstrukturen (z.B. gleichnamige Vorlesung)
  • Lesen englischsprachiger Literatur
  • Vorteilhaft sind Grundkenntnisse in Statistik und/oder Machine Learning (oder die Bereitschaft sich einzuarbeiten)

Anmeldung

Die Teilnehmerzahl ist begrenzt durch die Anzahl an Themen. Die Anmeldung erfolgt über AGNES.

Ablauf

Im Oktober/November wird es 1-2 Vorlesungen zu einführenden Themen geben.

Das Seminar wird als Blockseminar am Ende des Semesters abgehalten.

  • Jede Gruppe muss am Ende des Semesters einen ca. 30-40 minütigen Vortrag über das zugewiesene Thema halten.
  • Vorher finden mindestens zwei Treffen mit dem/der Betreuer(in) statt, einmal zur Vorbesprechung des Themas und einmal zur Besprechung der Folien.
  • Außerdem wird es in der Mitte des Semesters einen Termin geben, in dem alle Gruppen in einer 5-minütigen Flash-Präsentation ihr Thema vorstellen, um Querverbindungen zu erkennen und die rechtzeitige Beschäftigung mit dem Thema sicherzustellen.
  • Schließlich muss zu jedem Thema eine ca. 20 seitige Seminararbeit verfasst werden.
  • Parallel zur konzeptionellen Durchdringung des Themas müssen alle Gruppen ihr Verfahren experimentell evaluieren.

Schein und Anrechenbarkeit

Das Seminar ist anrechenbar für

  • Diplom Informatik
  • Master Informatik
  • Master Wirtschaftsinformatik

Voraussetzungen für den Schein sind:

  • der Besuch der Einführungsveranstaltungen zur Themenvergabe,
  • die regelmäßige Kommunikation mit dem Betreuer,
  • eine Kurzpräsentation des Themas (etwa in der Mitte des Semesters),
  • das Halten eines wissenschaftlichen Vortrags im Blockseminar am Ende des Semesters,
  • Die Reproduktion von Experimenten,
  • das Erstellen einer schriftlichen Ausarbeitung (Seminararbeit).

Vorlagen