Projekt 1 – Data Base Development, Management & Privacy

Kurzbeschreibung

Projekt 1 ‚Data Base Development, Management & Privacy‘ beschäftigt sich vor allem mit der Fragestellung, wie und in welcher Form Gesundheitsdaten, die als Parametrisierungs-grundlage für die anderen Forschungs- und Anwendungsprojekte dienen, (daten)sicher zur Verfügung gestellt werden können. Hauptaugenmerk liegt hierbei auf der Einrichtung eines gemeinsamen Forschungs-Servers, der den dexhelpp Partnern neben der sicheren Bereitstellung von Daten auch noch mit Rechenleistung für Simulationen und Datenanalysen zur Verfügung stehen soll.

Ziele und Methoden

Die Ziele des Projektes kann man in folgende Punkte gliedern:

  • Aufbau eines Research-Servers.
    Um die sensible Datenlage in dexhelpp und die notwendige Verfügbarkeit der Daten in für Forschungszwecke zu vereinen ist es notwendig eine zentrale Anlaufstelle und ein gemeinsames Arbeitsprotokoll für den Umgang mit Daten zu definieren. Als oberste Instanz soll hier ein gemeinsam genutzter Forschungs-Server dienen, der einerseits allen dexhelpp Partnern je nach Berechtigung zu Forschungszwecken mit großer Rechenkapazität zur Verfügung steht und andererseits als sicherer Datenpool dient. Oberste Priorität ist hierbei, dass zur Verfügung stehende Daten auch auf dem Server analysiert werden und ebendiesen nie verlassen können.

  • Aufbau von Datenstrukturen.
    Eine große Herausforderung bei der Installation des Servers ist die Eingliederung der stark heterogenen Gesundheitsdaten, die neben unterschiedlichen Formaten, Messmethoden und Quellen auch noch stark unterschiedliches Sicherheitsniveau haben. Auch das Zusammenführen (Record Linkage) ähnlicher Daten von unterschiedlichen Quellen spielt hier eine entscheidende Rolle.

  • Sicherheit der Daten am Server.
    Neben Sicherheitskonzepten für den Login der Partner stellt auch die Garantie des sicheren Umgangs mit den Daten am Server eine große Herausforderung dar. Hierbei wird auf aktuellen Fingerprinting Konzepten aufgebaut, die jegliche – nicht nur unlautere - Verwendung von Daten sofort erkennen und Dokumentieren.

  • Datenauswertungen und Abfragen
    Durch die Zusammenführung vieler heterogener Datensätze wird auch die simple Abfrage und Auswertung ebendieser zu einem komplexen Unterfangen. Somit beschäftig sich ein Teil des Projekts rein mit der Frage die gigantischen Datenstrukturen zu Überblicken und auf Bedarf der Partner für Forschungszwecke in kleinen Portionen zur Verfügung zu stellen.

Erwartete Ergebnisse

Neben wissenschaftlichen Publikationen über die erarbeiteten Sicherheitskonzepte und Record-Linkage Methoden, stellt natürlich der funktionstüchtige Server selbst den Hauptoutput des Projektes dar.