Seminar Moderne Methoden der Informationsintegration
Prof. Dr. Ulf Leser
In dem Seminar werden aktuelle Themen aus dem Bereich der Informationsintegration behandelt. Diese zielen vor allem auf eine Reduktion der „Upfront“-Kosten, also auf eine schnellere und einfachere Realisierung von Integrationslösungen, deren eventuell zunächst mangelhafte Qualität Stück für Stück verbessert werden kann („Pay as you go“). Weitere Schwerpunkte sind die Integration von unstrukturierten Daten (Text, Informationsextraktion), Systeme zum Personal Information Management sowie die Einbeziehung von Web-Quellen.
Die Veranstaltung ist als Seminar in der praktischen Informatik anrechenbar. Die Teilnehmerzahl ist begrenzt, die Anmeldung erfolgt über Goya.
Termine und Ablauf
Am Mittwoch, den 21. Oktober 2009, findet von 15.00 c.t. bis 17.00 Uhr (Raum: 3.101) die Einführungsveranstaltung statt, die für alle Teilnehmer verpflichtend ist. Dort werden die Themen erläutert und an die interessierten Studenten vergeben.
Das Seminar wird als Blockseminar am Ende des Semesters abgehalten. Jeder Student (oder jede Gruppe von Studenten) muss einen ca. 30 minütigen Vortrag über das zugewiesene Thema halten. Außerdem wird es vor Weihnachten einen Termin geben, in dem alle Studenten in einer 5-minütigen Flash-Präsentation Ihr Thema vorstellen müssen, um Querverbindungen zu erkennen und die rechtzeitige Beschäftigung mit dem Thema sicherzustellen. Schließlich muss zu jedem Thema eine Seminararbeit verfasst werden. Zusätzlich zu der speziellen Literatur, über die die Vorträge gehalten werden, gibt es für alle Teilnehmer verpflichtende Einführungslektüre. Am Termin vor Weihnachten werden die dort vermittelten Kenntnisse im Rahmen einer kurzen Klausur überprüft. Das Bestehen der Klausur ist Voraussetzung für die weitere Teilnahme.
Alle Pflichttermine in der Übersicht:
- 21.10.2009, 15.00-17.00 Uhr: Einführungstermin (Raum 3.101)
- 15.11.2009 - 30.11.2009: Individuelle Themenbesprechung mit dem
Betreuer
- 18.12.2009, 10-12 Uhr, R 4.112: Flash-Präsentationen aller Themen
sowie Klausur
- 15.01.2010 - 31.01.2010: Individuelle Folienbesprechung mit dem Betreuer
- 05.02.2010, 10.00 - 16.00 Uhr: Blockseminar, Raum 4.112
- Bis 31.3.2010: Abgabe der Seminararbeit
Voraussetzungen für die Teilnahme
- Abgeschlossenes Grundstudium
- Grundkenntnisse in Informationsintegration
- Gute Kenntnisse in Datenbanken
- Lesen englischer Texte
Voraussetzungen für den Schein
- Bestehen der Klausur über die Einführungstexte
- Teilnahme an allen Terminen (Einführung, Kurzpräsentationen, Blockseminar)
- Wahrnehmung der individuellen Termine mit dem Betreuer.
- Ca. 30 min. Vortrag über das abgesprochene Thema
- Selbständiges Erstellung einer Seminararbeit im Umfang von 10-20 Seiten; Abgabe mit unterschriebener Selbständigkeitserklärung (siehe unten)
Vorlagen
- Schriftliche Ausarbeitung, Latex
- Vortrag, Powerpoint
- Vortrag, Keynote
- Text für die Selbständigkeitserklärung
- Checkliste für Vortrag und Seminararbeit
Themen
8 9
Thema |
Literatur |
Vortragende/r |
---|---|---|
Einführungslektüre (Pflicht) |
|
Alle |
Einführungslektüre (Empfohlen) |
|
Alle |
Einführungsveranstaltung |
Folien | Ulf Leser |
Deep Web |
||
Introduction |
|
|
Visual interface reconstruction |
|
|
Deep web integraton |
|
|
Web Information Extraction |
||
Declarative approaches |
|
Przewozny |
Web-Scale IE |
|
Fiedler |
HTML-to-records |
|
Scheidereiter |
Data Spaces |
||
Introduction |
|
|
iTrails |
|
Warmuth |
Integration with User Feedback |
|
|
Semantic Web: SparQL, Linked Data, Ontologies |
||
Linked Ontologies |
|
|
Linked Data |
|
|
Structured and Unstructured Data |
||
Entity Search |
|
Kibanov |
Entity Recognition structured/unstructured |
|
Krause |
Schema Matching |
||
Introduction |
|
|
COMA++ |
|
Zheng |