Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Seminar Similarity Search

Prof. Dr. Ulf Leser

Ähnlichkeitssuche liegt im Kern vieler Anwendungen, wie z.B. Suche nach ähnlichen Namen, nach ähnlichen Musikstücken, nach ähnlichen DNA Sequenzen, nach ähnlichen Ereignisse, nach ähnlichen Bildern, nach ähnlichen Objekten etc. Je nach Art der betrachteten Objekte (Strings, Bäume, Vektoren etc.) kommen dabei recht unterschiedliche Ähnlichkeitsmaße und Algorithmen zum Einsatz. Im Seminar betrachten wir verschiedene Probleme der (skalierbaren) Ähnlichkeitssuche und suchen nach Gemeinsamkeiten und charakteristischen Unterschieden in den verwandten Methoden.

Voraussetzungen

Gute Kenntnisse in Algorithmen, Indexstrukturen und Datenbanktechniken.

Schein und Anrechenbarkeit

Das Seminar ist anrechenbar für

  • Monobachelor Informatik
  • Kombibachelor Informatik
  • Monobachelor INFOMIT

Voraussetzung für den Schein ist:

  • das Verfassen einer Outline bis 1.12.2019,
  • das Halten eines Kurzvortrags kurz vor Weihnachten,
  • das Halten eines wissenschaftlichen Vortrags am Ende des Semesters,
  • das Erstellen einer schriftlichen Ausarbeiten (Seminararbeit)

Anmeldung

Die Teilnehmerzahl ist begrenzt, die Anmeldung erfolgt über AGNES.

Termine und Ablauf

Die Themen werden abstrakt vergeben (siehe unten). Es ist die Aufgabe aller TeilnehmerInnen, zu dem ihnen zugewiesenen Themen zu recherchieren, geeignete Forschungsarbeiten zu identifizieren und den Stand-der-Technik in einer Arbeit und zwei Vorträgen zusammenzufassen. Die Themen werden in der Regel von einzelnen Studierenden bearbeitet, es sind aber auch Paare möglich (mit höheren Anforderungen an Vortrag und Ausarbeitung). Zu einem Thema gehört die Diskussion von spezifischen Ähnlichkeitsmaßen und von Algorithmen zur Ähnlichkeitssuche.

Die folgenden Termine stehen fest:

  • Am 22.10.2019 findet von 11-13 Uhr in Raum 3.112 die Einführungsveranstaltung statt, die für alle Teilnehmenden verpflichtend ist. Dort werden die Themen erläutert und vergeben.
  • Bis 1.12.2019 muss ein Outline des Themas verfasst werden (Details werden in der ersten Stunde erläutert)
  • Am TBA (vor Weihnachten) muss jeder TeilnehmerIn einen 5-minütigen Flash-Präsentation zum Thema halten
  • Am TBA (Semesterende) muss jede TeilnehmerIn einen ca. 30 minütigen Vortrag über das zugewiesene Thema halten.
  • Bis 31.3.2020 muss eine 10-15 seitige Seminararbeit verfasst werden.

Materialien

Vorlagen


Themen

String (DNA) Similarity Eberlein
Sentence Similarity Arndt, Patzak
Text Similarity Day
Web page Similarity Sergelen, Othegraven
Tree Similarity Salek, Riese
Graph Similarity Beiker, Weber
Time Series Similarity
Music Similarity Kröger, Bektas
Image Similarity Zierle, Lahn
Workflow Similarity
Video Similarity Becker
Programm Similarity