Übung zu Text Analytics
Veranstaltung
Diese Übung begleitet die Vorlesung Text Analytics
Erster Übungstermin ist der 19.10.2012. Dieser Termin ist Pflicht für alle Teilnehmer. Unentschuldigtes Nichterscheinen hat den Ausschluss von der Übung zur Folge.
Ablauf
In der Übung werden verschiedene Aufgaben im Bereich des Information Retrieval bzw. des Text Minings zu lösen sein. Dazu werden wir oftmals öffentlich verfügbare Tools (UIMA, OpenNLP etc.) benutzten und auf verschiedenen, teilweise recht großen Textsammlungen (Medline, Genia etc.) arbeiten. Die Arbeit erfolgt in Gruppen a zwei Studierenden. Jede Gruppe muss alle Aufgaben erfolgreich bearbeitet haben (> 50% aller Punkte). Die Aufgaben werden an einem Übungstermin ausgegeben, und die Lösungen müssen meist zwei Wochen später von einem der Gruppenmitglieder im Rahmen eines kurzen Vortrags dargestellt werden. In dem Vortrag geht es vor allem darum, gesammelte Erfahrungen an die gesamte Zuhörerschaft zu kommunizieren.
Wettbewerb (freiwillig)
Die Übung wird auch als Wettbewerb gestaltet. Das heißt, dass manche der Aufgaben verschieden gut gelöst werden können (schnellere Implementierung, bessere Qualität des Mining etc.). Die drei besten Gruppen erhalten Punkte, und am Ende wird ein Gesamtsieger gekürt. Die Teilnahme an dem Wettbewerb ist freiwillig.
Die einzelnen Aufgaben und Termine
Diese Liste wird ständig aktualisiert. Folien zu den Aufgaben und notwendige Daten werden hier veröffentlicht.
- 25.10.2012: Einführung in die Übung 25.10.2012: Übung1
- 8.11.2012: Übung2 9.11.2012: Corpus
- 22.11.2012: Übung3 22.11.2012: Gene Names 22.11.2012: Stop Words 22.11.2012: Goldstandard 22.11.2012: Predictions 22.11.2012: Evaluation Script-Scala Evaluation Script-JVM 22.11.2012: Evaluation Corpus ------------------------ 2.12.2012: Short description of assignment 3
- 6.12.2012: Übung4 6.12.2012: Gene Names 6.12.2012: Goldstandard corpus 6.12.2012: Evaluation Corpus
- 10.1.2013: Übung5 10.1.2013: Corpus
- 31.1.2013: Übung6 31.1.2013: Spam 31.1.2013: Ham