Forschung
Unsere Forschungsvision
Der Lehrstuhl für Rechnerorganisation und Kommunikation forscht im Bereich der verlässlichen Systeme (dependable systems). Der Begriff Verlässlichkeit umfasst eine Kombination aus verschiedenen Systemeigenschaften, welche zusammengefasst betrachtet werden: Verfügbarkeit (availability), Zuverlässigkeit (reliability), Sicherheit (safety), Integrität (integrity) und Wartbarkeit (maintainability).
Unsere Gruppe beschäftigt sich mit Konzepten, Methodiken, Algorithmen und Technologien, um verlässliche Systeme in verschiedenen Anwendungsgebieten realisieren zu können - von eingebetteten Echtzeitsystemen, über mobile Geräte, Standard-PC-Architekturen, Enterprise-Systeme bis hin zu Cloud Computing Szenarien.
Unsere Forschung orientiert sich an drei Grundkonzepten zur Realisierung verlässlicher Systeme. Diese können zur Design- oder zur Laufzeit (offline vs. online) eine Rolle spielen.
- Datenerfassung (data acquisition): Konzepte zur Datenerfassung konzentrieren sich auf die quantitative Beobachtung und Einschätzung von Systemen, was im Gegensatz zu vielen rein qualitativen Ansätzen steht. Die erfassten Daten werden einerseits dazu verwendet, Systemeigenschaften einzuschätzen und abzuleiten. Auf der anderen Seite können sie zur Laufzeit überwacht werden, um den aktuellen Systemzustand permanent zu evaluieren. Beispiele aus unserer Forschung sind die Laufzeitüberwachung von Hardware- und Softwarekomponenten, oder die Ausnutzung von Ortungsinformationen zur Erhöhung der Verlässlichkeit von Systemen.
- Evaluierung (evaluation): Konzepte zur Evaluierung von verlässlichen Systemen beschäftigen sich mit der Analyse und Interpretation erfasster Daten, um zukünftige Fehler vorherzusagen oder eingetretene Fehler zu diagnostizieren. Letzteres enthält dabei die Lokalisierung (diagnosis) und die Ursachenanalyse (root cause analysis) für einzelne Fehler oder ganze Systemausfälle.
- Aktion (action): Mit Konzepten für geeignete Aktionen in verlässlichen Systemen kann die angestrebte Erhöhung der Systemverlässlichkeit erreicht werden, da hier die Ergebnisse der Datenerfassung und Evaluierung in echte proaktive oder reaktive Aktivitäten münden. Im Falle der (online) Laufzeitüberwachung werden Aktionen angestossen, die einen drohenden Ausfall entweder vermeiden oder seine Auswirkungen eindämmen, im Falle der (offline) Systemanalyse soll besteht die Aktivität in einer geeigneten Anpassung des Systemdesigns.
Die drei Grundbestandteile eines verlässlichen Systems werden in unserer Forschung durch allgemeine Techniken zur Bewertung (Assessment), zur Modellierung (Modeling) und Gestaltung (Design) von Systemkomponenten und ganzen Systemen ergänzt. Modelle spielen dabei u.a. eine entscheidende Rolle, um Verlässlichkeitseigenschaften geeignet einschätzen zu können. Typische Beispiele sind die Ermittlung von Dienstgüteeigenschaften (service level agreements) und Dienstgütezielen (service level objectives). Ein Beispiel für den Querschnittsaspekt der Systemgestaltung ist die Kombination von Echtzeiteigenschaften und Verlässlichkeit in einer Systemarchitektur.
Forschungsthemen
Unsere Forschungsaktivitäten im Bereich verlässlicher Systeme sind thematisch wie folgt aufgestellt:
- Proaktive Fehlerbehandlung
- Adaptive und selbst-heilende Systeme
- Verfügbarkeitsbewertungen (SHIP Modell)
- Verlässlichkeit eingebetteter Systeme
- NOMADS – Netzwerk von mobilen adaptiven verlässlichen Systemen. Siehe NOMADS-Wiki.
- Mobile Kommunikation und Ad-Hoc Netzwerke
- Standortbezogene Dienste. Siehe Projekt MagicMap.
- Komponierbarkeit und Verifikation von Softwaresystemen
- Ausfallvorhersage für Hardware-Komponenten und komplexe Rechnersysteme
- Verlässlichkeit in Multi-Core / GPU Systemen
- Verlässlichkeit in verteilten Systemen, speziell in dienstorientierten Architekturen
- Stochastische Modellierung komplexer Systeme
- Planung und Umsetzung von Dienstgütevereinbarungen
Aktuelle Forschungsprojekte
-
Aletheia - Semantische Föderation umfassender Produktinformationen
Siehe auch Aletheia-Webseite der WiWi-Fakultät sowie Gesamtprojekt Aletheia-Webseite von SAP. Beiträge des Lehrstuhls ROK beziehen sich auf Systemarchitektur, Informationsgewinnung und Ortung (siehe auch Projekt MagicMap), sowie Informationsdarstellung. Mitarbeiter im Projekt am Lehrstuhl ROK: Peter Ibach - SmartKanban - Kanban-System auf Basis eigenintelligenter, vernetzter und ultrakostengünstiger Sensorknoten. Mitarbeiter im Projekt am Lehrstuhl ROK: Peter Ibach, Peter Tröger und Bratislav Milic
- MagicMap - Ein System zur kooperativen Positionsbestimmung über WLAN & RFID. Ansprechpartner: Peter Ibach
- METRIK - Graduiertenkolleg Modellbasierte Entwicklung von Technologien für selbstorganisierende dezentrale Informationssysteme im Katastrophenmanagement. Mitarbeiter am Lehrstuhl ROK: Andreas Dittrich
-
Proactive Fault Management in the Cloud - Cloud Computing stellt neue Mittel bereit, physikalische Redundanz dynamisch zu verwalten, und somit proaktives Fehlermanagement zu unterstützen.
Ansprechpartner: Felix Salfner
Abgeschlossene Projekte
- InterVal - Internet and Value Chains (BMBF, 2003-2007)
- CERO - CE Robots Community (Microsoft, 2003)
- DISCOURSE - The Berlin Distributed Computing Laboratory
- DFG-Projekt "QoS Management in heterogenen Rechnernetzen mit variabler Topologie"
- DFG-Projekt "Failure prediction in critical infrastructures"
- DFG-Projekt "Reliability and Performance of Service-Oriented Architectures"
- Graduiertenkolleg "Stochastische Modellierung und quantitative Analyse großer Systeme in den Ingenieurwissenschaften"
- Motherboard Fehlervorhersage (Intel, 2006-2008)
Forschungsseminar
Aktuelle Forschungsarbeiten werden wöchentlich im Forschungsseminar präsentiert und diskutiert.
Studien- und Diplomarbeiten
- Studien- und Diplomarbeiten (laufende und abgeschlossene Arbeiten)
- Liste der aktuellen Themenausschreibungen
Publikationen
Verantwortlich für die Seite: Felix Salfner