ATC-ICD: Machine Learning Methode

Im Jahr 2019 wurde im Projekt ATC-ICD New Models eine neue Methode zur Prävalenzschätzung entwickelt. Unter Anwendung von Methoden des maschinellen Lernens, genauer des Natural Language Processings, werden zum Erlernen des Modells die abgerechneten Medikamente und Diagnosen jeder Person, für die diese Daten vorliegen, in chronologischer Reihenfolge (sogenannte “Patient Histories”), zusammen mit Alter und Geschlecht, verwendet.

Diese Methode wurde auf Abrechnungsdaten aus dem Jahr 2007 angewendet. Das untere Balkendiagramm zeigt einen Vergleich zwischen Modellergebnissen des neuen Machine-Learning Modells (ML) und Referenzzahlen für das Jahr 2007.

Zusätzlich können die Ergebnisse des statistischen ATC-ICD Modells dargestellt werden. Diese liegen auf Ebene der ICD-10 Gruppen für das Jahr 2015 vor. Die entsprechenden Referenzzahlen sind deswegen auch für das Jahr 2015 angegeben.

Die zusätzlichen Referenzzahlen beruhen auf Daten der österreichischen Gesundheitsbefragung 2006/2007 bzw. auf Daten des Deutschen Zentrums für Krebsregisterdaten (ZfKD) im Robert Koch-Institut, umgelegt auf die österreichische Bevölkerung. Eine genaue Quellenangabe dazu finden Sie hier.

Der Stand der Modellentwicklung weist momentan einige Schwächen auf. Das neue Modell hat insbesondere Schwierigkeiten mit der Zuordnung von ICD-Gruppen zu Patienten, die Medikamente aus unterschiedlichen Wirkungsgruppen verschrieben bekommen haben. Dies zeigt sich auch in den Balkengrafiken: Für die Referenzzahlen ist das neue Modell dem alten deutlich unterlegen. An Verbesserungen des Modells wird momentan gearbeitet.