Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Seminar Saving Energy in Data Analysis

Prof. Dr. Ulf Leser

Large-scale data analyses are among the most energy-hungry tasks in computer science. They often crunch large data sets, perform compute intensive learning and inference steps, and sometimes repeat their computations thousands of times to reduce statistical uncertainties. However, computer science must realize that the days of cheap and abundant energy availability are gone, and that future systems and projects must take energy consumption and carbon production much more serious. In the seminar, we study recent and traditional methods in this field, ranging from energy measurement over energy-efficient algorithms to carbon-aware scheduling of tasks. Students will build 2-person teams working on a subject of choice; each team will perform independent literature research, prepare a short thesis proposal, give a joint presentation, and write a thesis.

Voraussetzungen

Gute Kenntnisse in Programmiersprachen und Algorithmen; Grundkenntnisse in verteilten Systemen

Schein und Anrechenbarkeit

Das Seminar ist anrechenbar für

  • Bachelor Informatik

Voraussetzung für den Schein ist:

  • die Abgabe einer Outline (Abstract, Struktur, Literaturliste)
  • das erfolgreiche Halten eines kurzen (5min) und eines längeren Vortrags (20-30min)
  • das Verfassen einer Seminararbeit (10-15 Seiten)

Anmeldung

Die Teilnehmerzahl ist begrenzt, die Anmeldung erfolgt über AGNES.

Termine und Ablauf

Das Seminar findet in Präsenz statt. Die Themen werden abstrakt vergeben (siehe unten). Es ist die Aufgabe aller Teilnehmer*innen, zu dem ihnen zugewiesenen Themen zu recherchieren, geeignete Forschungsarbeiten zu identifizieren und den Stand-der-Technik in einer Arbeit und zwei Vorträgen zusammenzufassen. Auf Wunsch können Themen auch praktische Arbeiten nach sich ziehen. Die Themen werden in der Regel in Gruppen a zwei Studierenden bearbeitet. Es gilt:

  • Am 20.10.2023, 13-15 Uhr, Raum RUD 25, 3.101, findet die Einführungsveranstaltung statt, die für alle Teilnehmenden verpflichtend ist. Dort wird Inhalt und Ablauf des Seminars vorgestellt sowie die Themen erläutert und vergeben.
  • Jede Gruppe muss zwei Vorträge halten:
    • Termin tba (Semestermitte): Einen 5 Minuten "Teaser Talk" zur Themenvorstellung
    • Termin tba (Semesterende): Einen 20-30 Minuten Seminarvortrag
  • Jede Gruppe muss zwei schriftliche Abgaben erledigen:
    • Bis 13.11.2023: Ein Outline des Themas verfassen (Titel, Abstract, Struktur, Literaturverzeichnis). Markieren Sie die drei für ihre Arbeit wichtigsten Publikationen.
    • Termin tba: Eine 10-15 seitige Seminararbeit.

Materialien

 

Vorlagen

 

Themen

Topic Supervisor Students
Energy consumption of data science and regulationsFLMB, TM
Intel RAPL and beyondUL
Energy-efficient processing units: ARM, Intel, GPU, FPGA and beyondUL
Energy-efficient data / network transferFL
Dynamic voltage and frequency scalingUL
Energy efficiency and programming languagesFLAT, KW
Energy efficient sortingULBP
Energy-aware machine learningULDG
Energy-aware query optimizationULCK
Predicting energy consumption of workflowsFLCB, GG
Energy-aware workflow schedulingFLNL
Carbon-aware schedulingFLSM