Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Seminar From Genes and Machines

Aktuelle Themen der (algorithmischen) Datenanalyse in der Bioinformatik

Prof. Dr. Ulf Leser, Philippe Thomas, Stefan Kröger, Karin Zimmermann

 

Moderne Hochdurchsatzverfahren der Biologie generieren immer größer werdende Datenmengen. Datamining und statistische Datenanalyse sind notwendig, um diese Daten zu prozessieren und sie effizient auszuwerten. Im Seminar werden Methoden und Techniken aus den Themenfeldern DNA-Sequenzierung, Genechips, Proteomics, SNP-Calling, Gene Set Enrichment Analysis, Gene Networks diskutiert.


Voraussetzungen

Zur Teilnahme sind minimale Grundkenntnisse im Biologie notwendig bzw. zu Beginn des Seminars selbstständig zu erarbeiten.


Schein und Anrechenbarkeit

Das Seminar ist anrechenbar für

  • Diplomstudiengang Informatik, Hauptstudium Praktische Informatik, 3SP
  • Monobachelor Informatik, Wahlpflichtbereich, 3SP
  • Master Wirtschaftsinformatik, 3SP

Voraussetzung für den Schein ist:

  • das Halten eines wissenschaftlichen Vortrags,
  • das Erstellen einer schriftlichen Ausarbeitung (Seminararbeit)
  • die einmalige Übernahme der "Opponentenrolle" (siehe unten)

 

Anmeldung

Die Teilnehmerzahl ist begrenzt, die Anmeldung erfolgt über Goya.

 

Termine und Ablauf

Am Montag, den 23.04.2012, findet von 15.00-17.00 Uhr die Einführungsveranstaltung statt, die für alle Teilnehmer verpflichtend ist. Dort werden die Themen erläutert und vergeben.

Das Seminar wird als Blockseminar am Ende des Semesters abgehalten. Jeder Student (oder jede Gruppe von Studenten) muss einen ca. 20+10 minütigen Vortrag über das zugewiesene Thema halten. Vorher muss der Betreuer mindestens zweimal getroffen werden, einmal zur Vorbesprechung des Themas und einmal zur Besprechung der Folien. Außerdem wird es einen Termin (01.06.2012) geben, in dem alle Studenten in einer 5-minütigen Flash-Präsentation ihr Thema vorstellen, um Querverbindungen zu erkennen und die rechtzeitige Beschäftigung mit dem Thema sicherzustellen. Schließlich muss zu jedem Thema eine Seminararbeit verfasst werden.

Zu jedem Thema wird ein(e) Studierende(r) vorab als Opponent(in) ausgewählt. Der/Die Opponent(in) liest ebenfalls die zum Thema ausgegebene Literatur und bereitet für den Vortragstermin kritische Fragen zu deren Inhalt vor, die dann im Seminar diskutiert werden. Ziel ist nicht das Aufdecken von Verständnisproblemen beim Vortragenden, sondern die kritische Auseinandersetzung mit dem Thema.

Zusätzlich zu der speziellen Literatur, über die die Vorträge gehalten werden, gibt es für alle Teilnehmer verpflichtende Einführungslektüre.

Alle Pflichttermine in der Übersicht:


Vorlagen

 

Bemerkungen:

Dieses Seminar setzt bioinformatorische Grundkenntnisse voraus und empfiehlt sich deshalb besonders für Studierende, welche die Vorlesung "Algorithmische Bioinformatik" bereits besucht haben.

Themengebiete (Einführungslektüre)

Vortragende(r) Opponent(in) Betreuer(in)
Peak Calling in NGS

Horner et al. (2009) "Bioinformatics approaches for genomics and post genomics applications of next-generation sequencing" Briefings in Bioinformatics

Pepke et al. (2009) "Computation for ChIP-seq and RNA-seq studies" Nature Methods

    Stefan Kröger
Modelling of gene expression:

Bintu et al. (2005) "Transcriptional regulation by the numbers: models."Curr Opin Genet Dev

Bintu et al. (2005) "Transcriptional regulation by the numbers: applications."Curr Opin Genet Dev

Kuhlman et al. (2007) "Combinatorial transcriptional control of the lactose operon of Escherichia coli."PNAS

    Philippe Thomas
Next Generation Read alignment:

Bintu et al. (2005) "A survey of sequence alignment algorithms for next-generation sequencing."Briefings in Bioinformatics

Langmead et al. (2009) "Ultrafast and memory-efficient alignment of short DNA sequences to the human genome."Genome Biology

Daniel Will Martina Klünemann Philippe Thomas
SNP Calling - Mutation Detection:

Li et al. (2008) "Mapping short DNA sequencing reads and calling variants using mapping quality scores."Genome Research

Altmann et al. (2011) "vipR: variant identification in pooled DNA using R."Bioinformatics

    Philippe Thomas
Gene Set Enrichment Analysis      
Einführungslektüre

Goeman and Bühlmann(2006) "Analyzing gene expression data in terms of gene sets: methodological issues"Bioinformatics

Dinu et al. (2008) "A Biological Evaluation of Six Gene Set Analysis Methods for Identification of Differentially Expressed Pathways in Microarray Data" Cancer Inform.

    Karin Zimmermann
GSEA:

Subramanian et al. (2005) "Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles" PNAS

Martina Klünemann Daniel Will Karin Zimmermann
Tian:

Tian et al. (2007) "Discovering statistically significant pathways in expression profiling studies" PNAS

    Karin Zimmermann
SAM-GS:

Dinu et al. (2007) "Improving gene set analysis of microarray data by SAM-GS" BMC Bioinformatics

    Karin Zimmermann
Microarrays      
Einführungslektüre

Hoheisel(2006) "Microarray technology: beyond transcript profiling and genotype analysis"Nature Reviews

Allison et al. (2005) "Microarray data analysis: from disarray to consolidation and consensus" Nature Reviews

    Karin Zimmermann
Differential Analysis with limma and eBayes:

Smyth (2004) "Linear Models and Empirical Bayes Methods for Assessing Dierential Expression in Microarray Experiments"Statistical Applications in Genetics and Molecular Biology

    Karin Zimmermann
Gene Regulatory Networks      
Einführungslektüre

Hecker et al. (2008) "Gene regulatory network inference: Data integration in dynamic models—A review" Biosystems

Bansal et al. (2007) "How to infer gene networks from expression profiles"Molecular Systems Biology

   
ARACNE

Margolin et al. (2006) "ARACNE: An Algorithm for the Reconstruction of Gene Regulatory Networks in a Mammalian Cellular Context" BMC Bioinformatics

Markus Matzker Sven Lund Stefan Kröger
MNI

Gardner and Faith (2005) "Reverse-engineering transcription control networks."Physics of Life Reviews

    Stefan Kröger
Banjo

Yu et al.(2002) "Using Bayesian Network Inference Algorithms to Recover Molecular Genetic Regulatory Networks"Proc. of "In International Conference on Systems Biology"

Sven Lund Markus Matzker Stefan Kröger