Abbildung: Beispielhafte Darstellung der Datenorganisation in einer relationalen Datenbank bei einer Krankenkasse
Dazu wurden unterschiedliche KI-gestützte Prädiktionsmodelle (u. a. Random Forest, Neuronale Netze, Adaptive Boosting) zur Vorhersage von zwei poststationären Ereignissen (Ungeplante Wiederaufnahme, Mortalität) entwickelt und mit klassischen Regressionsanalysen verglichen. Beim Vergleich wurden neben der Vorhersagegenauigkeit auch Aspekte zur Erklärbarkeit, Übertragbarkeit und Implementierbarkeit der Modelle berücksichtigt. Die Grundlage bildeten Routinedaten der vier projekt-beteiligten Krankenkassen (BAHN-BKK, Novitas BKK, Pronova BKK und SBK) zu ca. 1,4 Mio. Versicherten.
Aus den Analysen konnten folgende Erkenntnisse abgeleitet werden:
- Bei identischer Datenbasis sind KI-Verfahren nicht per se den klassischen Regressionsverfahren überlegen. Es besteht weiterer Forschungsbedarf, inwiefern umfangreichere bzw. komplexere Datensätze mit weiterführenden Methoden ausgewertet werden können, um das Potenzial von KI-Verfahren auszuschöpfen.
- GKV-Routinedaten sind grundsätzlich für den Einsatz mit KI geeignet, wobei ihre Vorteile (Datenqualität, Umfang) und Nachteile (Datenverzug, rechtliche Auflagen) in Hinblick auf das Modelltraining und die spätere Anwendung in der Praxis abzuwägen sind.
Darüber hinaus wurde projektbegleitend ein Weißbuch erstellt. Darin wird nicht nur in die Themenwelten “GKV-Routinedaten” und “KI-Analysetechniken” eingeführt, sondern es umfasst auch praktische Umsetzungshilfen (z. B. Tipps zur Datenaufbereitung, Code-Beispiele) sowie einen Ausblick auf mögliche Anwendungszwecke und deren technische und gesetzliche Anforderungen.
Das Weißbuch steht ab sofort kostenfrei zum Download bereit.