Projekt 2 – Data & Methods

Kurzbeschreibung

Ähnlich wie in Projekt 6 zielte das Projekt 'Data and Methods' auf die Entwicklung von Methoden ab. Insbesondere drehte es sich hierbei um Methoden für die Handhabung und Bereitstellung von Daten sowie Techniken zur Verbesserung von Simulationsresultaten.

Projekterfolg

Der Fokus dieses Projektes lag, wie der Name schon sagt, auf der Analyse von Daten sowie der Entwicklung von Methoden. Hierbei wurde grob zwischen Methoden zur Datenbearbeitung und Methoden zur Simulation unterschieden. Die umgesetzten Schwerpunkte können in folgenden Fragestellungen zusammengefasst werden:

Wie erkennt man Ausreißer bei hochkomplexen Gesundheitsdatensätzen?
Es nützt das hochinnovativste statistische Verfahren nichts, ist ein Datensatz durch sogenannte Ausreißer verfälscht. Diese Datensätze zeichnen sich vor allem durch signifikant abweichende Werte aus und entstehen insbesondere durch Datenfehler oder Messfehler. In jedem Fall verfälschen sie Statistiken und müssen dementsprechend gefiltert werden. Im Anwendungsfall von Gesundheitsdaten ist dieser Prozess durch die Inhomogenität und Hochdimensionalität der Datensätzen sehr komplex. Hierfür wurden neue Techniken und Methoden entwickelt.
Wie standardisiert man Bevölkerung bzw. Bevölkerungsdaten?
Diese Frage hängt stark mit der Reproduzierbarkeit von Ergebnissen zusammen. Durch die entwickelten Methoden wurde sichergestellt, dass im Zuge von dexhelpp errechnete Ergebnisse einheitlich auf derselben standardisierten virtuellen Bevölkerung aufbauen. Dadurch wurden die Resultate reproduzier- und publizierbar.
Wie bestimmt man ob ein gewisses Simulationsmodell dem Realsystem entspricht?
Im Fall eines Matchboxautos ist der Detailgrad des vorliegenden verkleinerten Automodells sehr schnell und einfach zu eruieren. Man erkennt schnell die vorhandenen und insbesondere auch fehlenden Funktionen des Modells und kann dementsprechend den gültigen Einsatzbereich, d.h. den Bereich, in dem sich das Modell, wie das reale Vorbild verhält, rasch abstecken. Für ein dynamisches Simulationsmodell zur Prädiktion von Krankheiten am Computer ist dieser Prozess deutlich komplexer, da insbesondere auch die Mechaniken, Prozesse und kausalen Zusammenhänge im Realen Vorbild, im Unterschied zum Auto, nicht immer bekannt sind.
Wie bestimmt man Simulationsparameter wenn sie im Realsystem nicht direkt messbar sind?
Stellt man die Ausbreitung einer Infektionskrankheit abstrahiert wie eine sich ausbreitende Welle im Wasser vor so hat die Ausbreitungsgeschwindigkeit der Welle einen enormen Einfluss auf deren Ablauf. Leider ist es aber in der Realität nicht möglich die Ausbreitungsgeschwindigkeit der Krankheit direkt zu messen um diesem Parameter einen festen Wert zuzuordnen. Da aber z.B. Daten über die Länge der Grippewelle vorliegen, kann man versuchen den Parameter dahingehend zu schätzen, sodass die Simulationsresultate den Daten entsprechen. Man spricht hierbei von Kalibrierung.

Methoden

Für die statistischen Fragestellungen des Projektes wurden simulationsbasierte Methoden wie Bootstrapping und spezielle Sampling-algorithmen auf den vorhandenen Datensätzen verwendet. Um modelltechnischen Aufgaben zu lösen wurden Methoden wie Virtual Overlay Multi-Agent System (VOMAS) sowie Genetische- und Sintflut-Algorithmen getestet.

Erzielte Ergebnisse

Neben wissenschaftlichen Publikationen (siehe Link) wurden auch zahlreichte Bachelor, Diplom und Dissertationen in diesem Projekt betreut. Die dort behandelten Methoden tragen einerseits zur Datenaufbereitung und Datenanalyse von Routinedaten im Gesundheitswesen, andererseits zur Verbesserung der Qualität von Simulationsmodellen bei. Dadurch wurde und wird reproduzierbare und Stakeholder-orientierte Entscheidungsunterstützung ermöglicht.