Projekt 2 – Data & Methods

Kurzbeschreibung

Ähnlich wie in Projekt 6 zielt das Projekt 'Data and Methods' auf die Entwicklung von Methoden ab. Insbesondere dreht es sich hierbei um Methoden für die Handhabung und Bereitstellung von Daten sowie Techniken zur Verbesserung von Simulationsresultaten.

Ziele

Der Fokus dieses Projektes, liegt, wie der Name schon sagt, auf der Analyse von Daten sowie der Entwicklung von Methoden. Hierbei wird grob zwischen Methoden zur Datenbearbeitung und Methoden zur Simulation unterschieden. Die Schwerpunkte können in folgenden Fragestellungen zusammengefasst werden:

  • Wie erkennt man Ausreißer bei hochkomplexen Gesundheitsdatensätzen?
    Es nützt das hochinnovativste statistische Verfahren nichts, ist ein Datensatz durch sogenannte Ausreißer verfälscht. Diese Datensätze zeichnen sich vor allem durch signifikant abweichende Werte aus und entstehen insbesondere durch Datenfehler oder Messfehler. In jedem Fall verfälschen sie Statistiken und müssen dementsprechend gefiltert werden. Im Anwendungsfall von Gesundheitsdaten ist dieser Prozess durch die Inhomogenität und Hochdimensionalität der Datensätzen sehr komplex und bedarf neuer Techniken.

  • Wie standardisiert man Bevölkerung bzw. Bevölkerungsdaten?
    Diese Frage hängt stark mit der Reproduzierbarkeit von Ergebnissen zusammen. Werden im Zuge von dexhelpp errechnete Ergebnisse publiziert, so müssen diese einheitlich auf derselben standardisierten virtuellen Bevölkerung aufbauen.

  • Wie bestimmt man ob ein gewisses Simulationsmodell dem Realsystem entspricht?
    Im Fall eines Matchboxautos ist der Detailgrad des vorliegenden verkleinerten Automodells sehr schnell und einfach zu eruieren. Man erkennt schnell die vorhandenen und insbesondere auch fehlenden Funktionen des Modells und kann dementsprechend den gültigen Einsatzbereich, d.h. den Bereich, in dem sich das Modell, wie das reale Vorbild verhält, rasch abstecken. Für ein dynamisches Simulationsmodell zur Prädiktion von Krankheiten am Computer ist dieser Prozess deutlich komplexer, da insbesondere auch die Mechaniken, Prozesse und kausalen Zusammenhänge im Realen Vorbild, im Unterschied zum Auto, nicht immer bekannt sind.

  • Wie bestimmt man Simulationsparameter wenn sie im Realsystem nicht direkt messbar sind?
    Stellt man die Ausbreitung einer Infektionskrankheit abstrahiert wie eine sich ausbreitende Welle im Wasser vor so hat die Ausbreitungsgeschwindigkeit der Welle einen enormen Einfluss auf deren Ablauf. Leider ist es aber in der Realität nicht möglich die Ausbreitungsgeschwindigkeit der Krankheit direkt zu messen um diesem Parameter einen festen Wert zuzuordnen. Da aber z.B. Daten über die Länge der Grippewelle vorliegen, kann man versuchen den Parameter dahingehend zu schätzen, sodass die Simulationsresultate den Daten entsprechen. Man spricht hierbei von Kalibrierung.

Methoden

Für die statistischen Fragestellungen des Projektes werden simulationsbasierte Methoden wie Bootstrapping und spezielle Sampling-algorithmen auf den vorhandenen Datensätzen verwendet. Um modelltechnischen Aufgaben zu lösen werden Methoden wie Virtual Overlay Multi-Agent System (VOMAS) sowie Genetische- und Sintflut-Algorithmen getestet.

Erwartete Ergebnisse

Neben wissenschaftlichen Publikationen sind in diesem Projekt auch Bachelor, Diplom und Dissertationen verortet. Die dort behandelten Methoden sollen einerseits zur Datenaufbereitung und Datenanalyse von Routinedaten im Gesundheitswesen, andererseits zur Verbesserung der Qualität von Simulationsmodellen beitragen. Sie sollen schlussendlich reproduzierbare und Stakeholder-orientierte Entscheidungsunterstützung ermöglichen.