Humboldt-Universität zu Berlin - Mathematisch-Naturwissenschaftliche Fakultät - Wissensmanagement in der Bioinformatik

Humboldt-Universität zu Berlin | Mathematisch-Naturwissenschaftliche Fakultät | Institut für Informatik | Wissensmanagement in der Bioinformatik | Lehre | Archiv | WS 17/18 | Semesterprojekt Entwicklung einer Suchmaschine für Alternativmethoden zu Tierversuchen

Entwicklung einer Suchmaschine für Alternativmethoden zu Tierversuchen

Dozent: Ulf Leser

Hintergrund

Bevor ein Tierversuch im Rahmen eines wissenschaftlichen Projektes durchgeführt werden darf, muss dieser von einer zuständigen Behörde genehmigt sein. Dazu reichen die verantwortlichen Wissenschaftler einen Genehmigungsantrag ein, in welchem die Erfüllung von wissenschaftlichen und gesetzlichen Anforderungen dargelegt ist. Teil dieses Antrags ist eine sorgfältige Literaturrecherche um sicher zu stellen, dass der geplante Tierversuch nicht durch eine Alternativmethode ersetzt werden könnte. Eine solche Alternative wäre z.B. eine Methode oder ein Verfahren, mit welchem eine spezifische wissenschaftliche Fragestellung ohne den Einsatz lebender (Wirbel-)Tiere beantwortet werden kann, z.B. in vitro-Verfahren.

Obwohl es für biomedizinische Fragestellungen bereits verschiedene Suchmaschinen/Datenbanken gibt, die auch semantische Techniken zur Verfügung stellen, gibt es noch keine zufriedenstellende Lösung für die Suche von Alternativmethoden zu Tierversuchen.

Ziel des Semesterprojekts

In diesem Semesterprojekt soll ein Prototyp für eine Suchmaschine für Alternativmethoden zu Tierversuchen entwickelt werden, der auf PubMed/Medline aufsetzt. Dieser Prototyp soll den Antragssteller für einen Tierversuch (=Forscher) zukünftig in die Lage versetzen mittels Referenzdokumenten (Referenz-Publikationen aus PubMed), welche einen konkreten Tierversuch beschreiben, geeignete Vorschläge für Alternativmethoden zum Tierversuch zu finden. Darüber hinaus muss der Prototyp die Ergebnisse der Recherche (Trefferliste von Literaturzitaten) bezüglich ihrer thematischen Übereinstimmung zu den vorgegebenen Referenzdokumenten und ihrer Relevanz als potentielle Alternativmethode zu dem jeweiligen Tierversuch reihen. Dafür werden Methoden für Text Mining (z.B. `Information Retrieval´, `Named-entity Recognition´ bzw. `Relation Extraction´) auf dem neuesten Stand der Wissenschaft und Technik benutzt.

Termine

Für Treffen im Projekt ist prinzipiell der Termin Freitag, 9-12 Uhr im Raum 4.410 vorgesehen. Der erste Termin des Projekts findet aber abweichend am Montag, den 23.10.2017, von 15-17 Uhr in Raum 4.410 statt. An diesem müssen alle interessierten StudentInnen teilnehmen; das Projekt wird vorgestellt, die Gruppen gebildet, und die konkreten nächsten Schritte erörtert.

Struktur und prinzipieller Ablauf des Projekts

Das Semesterprojekt wird zusammen mit dem Deutschen Zentrum zum Schutz von Versuchstieren (Bf3R) am Bundesinstitut für Risikobewertung (BfR) konzipiert, organisiert und durchgeführt.

Die Studierenden erarbeiten konkrete technologische Anforderungen zur Umsetzung des Projekts in Gruppen. Das Projekt wird in vier Teilprojekte zerlegt: (a) Erstellung einer Datenbank mit ElasticSearch, in welcher die Dokumente indexiert werden; (b) Textmining innerhalb der Dokumente; (c) Erstellung der Benutzerschnittstelle (Webinteface); und (d) Erstellung der Middleware zur Kommunikation zwischen Datenbank – Textmining – Web Interface. Daneben wird es eine technische (studentische) Projektleitung geben. Die Entwicklung wird professionelle Werkzeuge wie GitHub benutzen und einen klassischen Verlauf über Use Cases, Spezifikation, Implementierung, Tests, Integration und Abnahme durch die Betreuer geben. Die Gruppen organisieren sich dazu in regelmäßigen Treffen selber und nehmen an moderierten, gruppenübergreifenden Treffen zur Absprache des Designs und der Schnittstellen teil. Am Ende des Semesters präsentieren die Studierenden gemeinsam eine lauffähige, modulare und dokumentierte Software in Gestalt eines Vortrags und eines Posters.

Die Betreuer übernehmen im Projekt die Rolle eines fiktiven Kunden, der eine Software in Auftrag gibt und vorgibt, wie das Endprodukt aussehen soll, aber nicht, wie man das am besten erreicht - das sollen die Studierenden im Projekt gemeinsam erarbeiten und umsetzen. Natürlich geben die Betreuer auch Hilfestellungen zu technischen Fragen und Schwierigkeiten durch.

Die Termine mit den Betreuern werden in der HU (Standort Berlin-Adlershof) und im BfR (Standort Berlin-Marienfelde) stattfinden. Termine im BfR werden auch Interviews mit potentiellen Benutzern (biomedizinischen Forschern) und einen Besuch der Labore des Bf3R enthalten.

Begleitprogramm

Das Projekt wird durch ein Begleitprogramm begleitet. Geplant sind Kurzvorlesungen unter Anderem zu den folgenden Themen:
  • Grundlagen von Suchmaschinen und semantische Suchmaschinen
  • Biomedizinisches Text Mining
  • Versionierung und Bugtracking mit Git(Hub)
  • Literaturrecherche in der Biomedizin
  • Tierversuch und 3R

Material und Zeitplanung

23.10. Einführungsveranstaltung (kick-off)
Bis 27.10. Todo (alle): Literatur; Model-View-Controler (MVC), ElasticSearch, Grails, MetaMap, Trello
27.10. - Aufteilung in Teilprojekte und Teams, initiale Festlegung benutzter Technologien, Anfang der Spezifikation, Priorisierung der Features [Folien]
- Vortrag "Versionierung und Bugtracking mit GitHub" (Marc Bux)
03.11. Termin im BfR Berlin-Marienfeld (um 9:15 beim Pförtner)
10.11. - Demo 1. Sprint
- Vortrag "Webprogrammierung" (Johannes Starlinger)
- Sprint Planning
17.11. - Update von Teams
- Vortrag "Theoretische Grundlagen des Information Retrievals" (Daniel Butzke)
24.11. - Vortrag "Natural Language Processing" (Mariana Neves)
- 2. Sprint + Sprint Planning
01.12. - Vortrag "Strategien zur Dekodierung des `Versuchszwecks´" (Daniel Butzke, Mariana Neves)
- Update von Teams
08.12. 3. Sprint + Sprint Planning
15.12. Backlog Grooming und Technical Refinement
22.12. 4. Sprint + Sprint Planning
12.01. - Vortrag "A Technical Introduction to the Semantic Search Engine Semedico" (Erik Fäßler, Uni. Jena)
- Backlog Grooming und Technical Refinement
19.01. - Vortrag "Gamification for Searching for Alternative Methods to Animal Experiments" (Mariana Neves)
- Evaluation der Lehrveranstaltung
- 5. Sprint + Sprint Planning
26.01. Backlog Grooming und Technical Refinement
02.02. - Termin im BfR Berlin-Marienfeld: Besuch zu den Versuchstiere (um 9:15 beim Pförtner)
- 6. Sprint
09.02. Projektpräsentation im BfR Berlin-Marienfeld (11-13 Uhr, Raum D146)
16.02. Projektabschluss