Entwicklung einer Suchmaschine für Alternativmethoden zu Tierversuchen
Hintergrund
Bevor ein Tierversuch im Rahmen eines wissenschaftlichen Projektes durchgeführt werden darf, muss dieser von einer zuständigen Behörde genehmigt sein. Dazu reichen die verantwortlichen Wissenschaftler einen Genehmigungsantrag ein, in welchem die Erfüllung von wissenschaftlichen und gesetzlichen Anforderungen dargelegt ist. Teil dieses Antrags ist eine sorgfältige Literaturrecherche um sicher zu stellen, dass der geplante Tierversuch nicht durch eine Alternativmethode ersetzt werden könnte. Eine solche Alternative wäre z.B. eine Methode oder ein Verfahren, mit welchem eine spezifische wissenschaftliche Fragestellung ohne den Einsatz lebender (Wirbel-)Tiere beantwortet werden kann, z.B. in vitro-Verfahren.Obwohl es für biomedizinische Fragestellungen bereits verschiedene Suchmaschinen/Datenbanken gibt, die auch semantische Techniken zur Verfügung stellen, gibt es noch keine zufriedenstellende Lösung für die Suche von Alternativmethoden zu Tierversuchen.
Ziel des Semesterprojekts
In diesem Semesterprojekt soll ein Prototyp für eine Suchmaschine für Alternativmethoden zu Tierversuchen entwickelt werden, der auf PubMed/Medline aufsetzt. Dieser Prototyp soll den Antragssteller für einen Tierversuch (=Forscher) zukünftig in die Lage versetzen mittels Referenzdokumenten (Referenz-Publikationen aus PubMed), welche einen konkreten Tierversuch beschreiben, geeignete Vorschläge für Alternativmethoden zum Tierversuch zu finden. Darüber hinaus muss der Prototyp die Ergebnisse der Recherche (Trefferliste von Literaturzitaten) bezüglich ihrer thematischen Übereinstimmung zu den vorgegebenen Referenzdokumenten und ihrer Relevanz als potentielle Alternativmethode zu dem jeweiligen Tierversuch reihen. Dafür werden Methoden für Text Mining (z.B. `Information Retrieval´, `Named-entity Recognition´ bzw. `Relation Extraction´) auf dem neuesten Stand der Wissenschaft und Technik benutzt.Termine
Für Treffen im Projekt ist prinzipiell der Termin Freitag, 9-12 Uhr im Raum 4.410 vorgesehen. Der erste Termin des Projekts findet aber abweichend am Montag, den 23.10.2017, von 15-17 Uhr in Raum 4.410 statt. An diesem müssen alle interessierten StudentInnen teilnehmen; das Projekt wird vorgestellt, die Gruppen gebildet, und die konkreten nächsten Schritte erörtert.Struktur und prinzipieller Ablauf des Projekts
Das Semesterprojekt wird zusammen mit dem Deutschen Zentrum zum Schutz von Versuchstieren (Bf3R) am Bundesinstitut für Risikobewertung (BfR) konzipiert, organisiert und durchgeführt.
Die Studierenden erarbeiten konkrete technologische Anforderungen zur Umsetzung des Projekts in Gruppen. Das Projekt wird in vier Teilprojekte zerlegt: (a) Erstellung einer Datenbank mit ElasticSearch, in welcher die Dokumente indexiert werden; (b) Textmining innerhalb der Dokumente; (c) Erstellung der Benutzerschnittstelle (Webinteface); und (d) Erstellung der Middleware zur Kommunikation zwischen Datenbank – Textmining – Web Interface. Daneben wird es eine technische (studentische) Projektleitung geben. Die Entwicklung wird professionelle Werkzeuge wie GitHub benutzen und einen klassischen Verlauf über Use Cases, Spezifikation, Implementierung, Tests, Integration und Abnahme durch die Betreuer geben. Die Gruppen organisieren sich dazu in regelmäßigen Treffen selber und nehmen an moderierten, gruppenübergreifenden Treffen zur Absprache des Designs und der Schnittstellen teil. Am Ende des Semesters präsentieren die Studierenden gemeinsam eine lauffähige, modulare und dokumentierte Software in Gestalt eines Vortrags und eines Posters.
Die Betreuer übernehmen im Projekt die Rolle eines fiktiven Kunden, der eine Software in Auftrag gibt und vorgibt, wie das Endprodukt aussehen soll, aber nicht, wie man das am besten erreicht - das sollen die Studierenden im Projekt gemeinsam erarbeiten und umsetzen. Natürlich geben die Betreuer auch Hilfestellungen zu technischen Fragen und Schwierigkeiten durch.
Die Termine mit den Betreuern werden in der HU (Standort Berlin-Adlershof) und im BfR (Standort Berlin-Marienfelde) stattfinden. Termine im BfR werden auch Interviews mit potentiellen Benutzern (biomedizinischen Forschern) und einen Besuch der Labore des Bf3R enthalten.
Begleitprogramm
Das Projekt wird durch ein Begleitprogramm begleitet. Geplant sind Kurzvorlesungen unter Anderem zu den folgenden Themen:- Grundlagen von Suchmaschinen und semantische Suchmaschinen
- Biomedizinisches Text Mining
- Versionierung und Bugtracking mit Git(Hub)
- Literaturrecherche in der Biomedizin
- Tierversuch und 3R
Material und Zeitplanung
23.10. | Einführungsveranstaltung (kick-off) |
Bis 27.10. | Todo (alle): Literatur; Model-View-Controler (MVC), ElasticSearch, Grails, MetaMap, Trello |
27.10. |
- Aufteilung in Teilprojekte und Teams, initiale Festlegung benutzter Technologien, Anfang der Spezifikation, Priorisierung der Features [Folien] - Vortrag "Versionierung und Bugtracking mit GitHub" (Marc Bux) |
03.11. | Termin im BfR Berlin-Marienfeld (um 9:15 beim Pförtner) |
10.11. |
- Demo 1. Sprint - Vortrag "Webprogrammierung" (Johannes Starlinger) - Sprint Planning |
17.11. |
- Update von Teams - Vortrag "Theoretische Grundlagen des Information Retrievals" (Daniel Butzke) |
24.11. |
- Vortrag "Natural Language Processing" (Mariana Neves) - 2. Sprint + Sprint Planning |
01.12. |
- Vortrag "Strategien zur Dekodierung des `Versuchszwecks´" (Daniel Butzke, Mariana Neves) - Update von Teams |
08.12. | 3. Sprint + Sprint Planning |
15.12. | Backlog Grooming und Technical Refinement |
22.12. | 4. Sprint + Sprint Planning |
12.01. |
- Vortrag "A Technical Introduction to the Semantic Search Engine Semedico" (Erik Fäßler, Uni. Jena) - Backlog Grooming und Technical Refinement |
19.01. |
- Vortrag "Gamification for Searching for Alternative Methods to Animal Experiments" (Mariana Neves) - Evaluation der Lehrveranstaltung - 5. Sprint + Sprint Planning |
26.01. | Backlog Grooming und Technical Refinement |
02.02. |
- Termin im BfR Berlin-Marienfeld: Besuch zu den Versuchstiere (um 9:15 beim Pförtner) - 6. Sprint |
09.02. | Projektpräsentation im BfR Berlin-Marienfeld (11-13 Uhr, Raum D146) |
16.02. | Projektabschluss |