Übung Algorithmische Bioinformatik
Professor Ulf Leser, Wintersemester 2007/2008
Die Übung begleitet den Halbkurs Algorithmische Bioinformatik. Wir implementieren, vergleichen und optimieren verschiedene in der Vorlesung besprochene Algorithmen und erproben sie an realen, biologischen Sequenzen. Die Übung wird in Gruppen durchgeführt. Einige der Aufgaben werden als ein Wettberwerb konzipiert, in dem man für die schnellste Implementierung Extra-Punkte bekommt. Am Ende des Semesters wird die Siegergruppe verkündet.
Die Anmeldung erfolgt über GOYA
ACHTUNG: Aufgrund der beschränkten Zahl verfügbarer Plätze ist der erste Termin (18.10.2007) ein Pflichttermin, bei dem die Plätze vergeben und die Gruppen gebildet werden
Ablauf
Die Übung wird in Gruppen á 2-3 Personen durchgeführt. Jede Übungsgruppe muss 7 Aufgabenblätter bearbeiten. Für die Bearbeitung stehen jeweils 2 Wochen zur Verfügung. Der Ablauf wird sich so gestalten, dass an einem Termin jeweils die neue Aufgabe gestellt und die Lösungen der alten Aufgabe besprochen werden. Dabei stellt eine Reihe von Gruppen ihre Lösung kurz vor; wer, wir bei Beginn der Stunde ausgelost (es müssen sich also alle vorbereiten). Kein Student darf zwei Lösungen vorstellen. Die Termine, an denen keine neuen Aufgaben gestellt werden, sind offene Frage- bzw. Diskussionsstunden.
Aufgaben und Abgabe
Abgabe der Lösungen: Bis 23.59 Uhr am Tag der vorgesehenen Abgabe per Mail an Prof. Leser.
Voraussetzung für den Erhalt eines Übungsscheines ist die Bearbeitung sämtlicher Aufgaben (in Gruppen). Jede Gruppe muss für jede Aufgabe mindestens die Hälfte der erreichbaren Punkte erreichen.
Wettbewerb
4-5 von den sieben Aufgaben werden konkurrierend zu lösen sein. Zusätzlich zu den Bewertungen für korrekt gelöste Aufgaben, die für den Übungsschein ausschlaggebend sind, gibt es 'Wettbewerbspunkte'. Die Lösungvorschläge entsprechen einem vorgegebenen Format und werden bewertet nach Effizienz, Rechenzeit, Speicherplatz u.ä. Für die am Semesterende insgesamt beste Gruppe wird es eine kleine Überraschung geben.
Termine im Einzelnen
Achtung: An den Terminen, an denen Lösungen besprochen und
neue Lösungen vorgestellt werden, herrscht Anwesenheitspflicht. Die
angegebenen Tage können sich noch verschieben.
- Erste Übung: 18.10.2007, ca. 14.30 Uhr (im Anschluß an die Vorlesung von Prof. Börner)
- Zweite Übung am 1.11.2007
- Testdaten: Patterndatei, Template (Vorsicht: 17MB gezipp'te Datei)
- Aufgabenblatt 1: Lineares Stringmatching in humaner DNA
- Dritte Übung am 15.11.2007
- Aufgabenblatt 2: Boyer-Moore Algorithmus und zirkuläre Strings
- Vierte Übung am 29.11.2007
- Aufgabenblatt 3: Suffix-Arrays und Repeats
- Bearbeitungszeit ist drei Wochen
- Fünfte Übung am 18.12.2007
- Aufgabenblatt 4: Globales Alignment:
- Daten zur Aufgabe; Sequenzen von Homo Sapiens, Maus, Schimpanse, Fruchtfliege und C.Elegans; Substitutionsmatrix für DNA
- Bearbeitungszeit: bis 16.1.2008 10.1.2008)
- Sechste Übung am 17.1.2008
- Aufgabenblatt 5: Lokales Alignment
- Sequenzen zweier verschiedener Herpesviren
- Sequenzen zweier verschiedener Coronaviren
- Bearbeitungszeit: Zwei Wochen, bis 30.1.2008
- Siebte Übung am 31.1.2008
- Aufgabenblatt 6: Hierarchisches Clustering
- Daten müssen Sie selber sammeln
- Bearbeitungszeit: 10 Tage, bis 11.2.2008