Übung zu Information Retrieval
Diese Übung begleitet die Vorlesung Information Retrieval
Erster Übungstermin ist der 29.10.2014. Dieser Termin ist Pflicht für alle Teilnehmer; die Übung wird vorgestellt und Gruppen werden gebildet. Unentschuldigtes Nichterscheinen hat den Ausschluss von der Übung zur Folge.
Ablauf
In der Übung werden verschiedene Aufgaben im Bereich des Information Retrieval praktisch zu lösen sein. Die Lösungen müssen entweder von Scratch implementiert werden oder die frei verfügbabre Suchmaschine Apache Lucene benutzen.
Die Arbeit erfolgt in Gruppen a zwei Studierenden. Jede Gruppe muss alle Aufgaben erfolgreich bearbeitet haben. Die Aufgaben werden an einem Übungstermin ausgegeben, und die Lösungen müssen meist zwei Wochen später von einem der Gruppenmitglieder im Rahmen eines kurzen Vortrags dargestellt werden. In dem Vortrag geht es vor allem darum, gesammelte Erfahrungen an die gesamte Zuhörerschaft zu kommunizieren.
Wettbewerb (freiwillig)
Die Übung wird auch als Wettbewerb gestaltet. Das heißt, dass manche der Aufgaben verschieden gut gelöst werden können (schnellere Implementierung, bessere Qualität des Mining etc.). Die drei besten Gruppen erhalten Punkte, und am Ende wird ein Gesamtsieger gekürt. Die Teilnahme an dem Wettbewerb ist freiwillig.
Die einzelnen Aufgaben und Termine
Diese Liste wird ständig aktualisiert. Folien zu den Aufgaben und notwendige Daten werden hier veröffentlicht.
- 29.10.2014: Einführung in die Übung
- 29.10.2014: Aufgabe 1: Die Größe des World Wide Web (Stand 5.11.2014)
- 12.11.2014: Aufgabe 2: Boolean Information Retrieval; Testcorpus
- 03.12.2014: Aufgabe 3: Boolean Information Retrieval mit Lucene
- 07.01.2015: Aufgabe 4: Synonym-Expansion mit Lucene und Wordnet; Korrigierte Fassung vom 23.1.2015
- 21.01.2015: Aufgabe 5: Signifikante Co-occurrencen; Korrigierte Fassung vom 4.2.2015