Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Data Science mit Python

Dr. Patrick Schäfer

Die Veranstaltung wird in Präsenz durchgeführt. Für die Teilnahme an der Vorlesung müssen sie sich für den Kurs über Agnes anmelden. Das Moodle Passwort wird dann über Agnes kommuniziert.

Die Einführungsveranstaltung findet am Donnerstag, 27.10.22, statt.

Diese Vorlesung gibt eine Einführung in den Bereich der Data Science, also der Extraktion von Wissen aus strukturierten oder unstrukturierten Daten. Der Kurs thematisiert dabei die typischen Aspekte des Data-Science-Projektzyklus wie Data Mining, Vorverarbeitung, Erzeugung von (statistischen) Merkmalen, explorative Datenanalyse, und maschinelles Lernen.

In der begleitenden Übun­g werden praktische Erfahrungen mit Fallstudien unter Verwendung von Standardbibliotheken im Python-Ökosystem wie Pandas, NumPy, Seaborn, Matplotlib oder Scikit-Learn gesammelt.

Termin (Präsenz)

Donnerstags 11:00 - 13:00 RUD 25, 3.001

Voraussetzungen

Rudimentäre Programmierkenntnisse in einer beliebigen Sprache werden vorausgesetzt. Kenntnisse in Python sind von Vorteil. Eine Kurzeinführung in Python wird vorlesungsbegleitend gegeben. 

Prüfungen und Anrechenbarkeit

Je nach Teilnehmerzahl ist die Prüfungen mündlich oder schriftlich. Die Prüfungsform wird in der ersten Semesterwoche bekannt gegeben. Voraussetzung für die Anmeldung zur Prüfung ist das Bestehen der Übung.

Das Modul ist anrechenbar für

  • Monobachelor Informatik, 5 SP
  • Kombinationsbachelor, 5 SP
  • INFORMIT, 5 SP

Literatur und weiterführende Links

  • Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython by Wes McKinney (Kostenfrei über die HU-Bibliothek als Download)
  • Data Science from Scratch - First Principles with Python by Joel Grus (Kostenfrei über die HU-Bibliothek als Download)
  • Schnellstart Python Ein Einstieg ins Programmieren für MINT-Studierende (Kostenfrei über die HU-Bibliothek als Download)

    Themen und Folien

    Folien sind in Moodle jeweils spätestens nach der Vorlesung als PDF verfügbar. Änderungen möglich. All slides are English, but the course will be held in German.