Die MethodIK

Wie funktioniert unsere Methodik zur Analyse und Prognose der COVID-19 Pandemie?

Flachheitsbasierte Analyse DES EPIDEMISCHEN ZUSTANDS

Die Analyse des epidemischen Zustands – auch epidemisches Nowcasting bezeichnet – bezieht sich auf die quantitative Bestimmung und Bewertung des aktuellen Stands der Epidemie. Das Hauptziel ist dabei, in Echtzeit Evidenz für politische Entscheidungen zu erzeugen. Eine wesentliche Herausforderung besteht darin, nicht messbare epidemische Zustände, wie etwa die Suszeptibilität der Bevölkerung aus den verfügbaren Daten zu bestimmen. Zudem wird das epidemische Geschehen durch zahlreiche unbekannte Faktoren getrieben, was eine Anwendung epidemiologischer Modelle zum Nowcasting schwierig macht.

Unsere Methode zum epidemiologischen Nowcasting beruht auf der Eigenschaft der differenziellen Flachheit, welche zahlreiche epidemiologische Modelle besitzen. Damit wurde ein sehr robuster Zugang geschaffen, durch welchen alle wesentlichen Zustände sowie auch abgeleitete Größen (z.B. der effektive  Reproduktionsfaktor R_{\text{eff}}) mit verhältnismäßig wenig Daten in Echtzeit bestimmt werden können.

Diese Methodik wurde im September 2021 im  Journal of Nonlinear Dynamics publiziert:

C. Hametner, M. Kozek, L. Böhler, A. Wasserburger, Z.P. Du, R. Kölbl, M. Bergmann, T. Bachleitner-Hofmann, S. Jakubek
Estimation of exogenous drivers to predict COVID-19 pandemic using a method from nonlinear control theory.
Nonlinear Dynamics 106, 1111–1125 (2021)
https://link.springer.com/article/10.1007%2Fs11071-021-06811-7

Das folgende Video gibt eine allgemein verständliche Erklärung des Prinzips:

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

KOMPARTMENTMODELLE UND EXOGENE TREIBER

Zur Beschreibung der Ausbreitung von COVID-19 werden in vielen Ländern Kompartmentmodelle als wesentliche Grundlage verwendet. Viele dieser Kompartmentmodelle weisen die Eigenschaft differenzieller Flachheit auf. Dies ermöglicht es, deren Zustände in einfacher Weise alleine aus den verfügbaren Infektionsdaten zu bestimmen. Aber auch unbekannte exogene Treiber, welche die Analyse und Prädiktion des hochdynamischen Infektionsgeschehens in vielen Ländern gravierend erschweren, können so einfach und direkt bestimmt werden. Exogene Treiber einer Epidemie umfassen Faktoren wie etwa soziales Verhalten der Bevölkerung, Mobilität, aber auch den quantitativen Effekt von Interventionsmaßnahmen wie z.B. Lockdowns.

SIR-Modell und die Beschreibung mehrerer Wellen

Das SIR-Modell ist eines der einfachsten Kompartmentmodelle, weshalb sich unsere Methodik anhand dieses Modells am besten erklären lässt. Viele heute gebräuchliche Modelle wurden aus dem SIR Modell abgeleitet und sind mit unserer Methodik kompatibel.

Das SIR Modell teilt die Bevölkerung in drei Kompartments:

 

„I“: Die infektiösen Individuen. Dies sind Personen, die infiziert wurden und in der Lage sind, suszeptible (empfängliche) Personen anzustecken.

„S“: Die suszeptiblen Individuen. Wenn ein suszeptibles und ein infektiöses Individuum in „infektiösen Kontakt“ kommen, zieht sich das suszeptible Individuum die Krankheit zu und wechselt in das infektiöse Kompartiment I.

„R“: Die genesenen (bzw. immunen) oder verstorbenen Individuen. Dies sind jene Individuen, die sich nach einer Infektion entweder erholt haben oder aber gestorben sind.

Die Größe jedes Kompartments kann im Laufe der Zeit stark schwanken. Die Bedeutung dieses dynamischen Aspekts wird bei einer endemischen Krankheit wie COVID-19 sehr deutlich: Solche Krankheiten brechen zyklisch aus, da die Zahl der suszeptiblen Individuen S(t) im Laufe der Zeit stark schwankt. Während einer epidemischen Welle nimmt die Zahl der suszeptiblen Individuen vorerst rasch ab, da immer mehr von ihnen infiziert werden. Bei einer neuerlichen Zunahme der suszeptiblen Individuen kann in Folge eine neue Infektionswelle losbrechen.

Einer Schätzung des Anteils der suszeptiblen Bevölkerung kommt deshalb bei der epidemiologischen Analyse eine besondere Bedeutung zu.

Die Kontaktlosen, exogene Treiber und differentielle Flachheit

Aufgrund politischer Interventionen zur Eindämmung des Infektionsgeschehens (z.B. Kontaktbeschränkungen, Lockdowns, u.s.w.) aber auch aufgrund von Impfung bzw. neuen Virusvarianten sind Individuen zeitlich veränderlichem Infektionsrisiko ausgesetzt. Um dem Rechnung zu tragen, werden Kompartmentmodelle typischerweise um eine Gruppe der „Kontaktlosen“ („C“, contactless) ergänzt. Variable Suszeptibilität der Bevölkerung kann nun durch einen Strom u(t) zwischen den kontaktlosen und suszeptiblen Individuen dargestellt werden. Dieser Strom beeinflusst maßgeblich das zukünftige epidemiologische Geschehen, er dient deshalb als sog. leading indicator der Epidemie. Je nach Struktur des Modells kann es nur einen, oder aber mehrere solcher Ströme geben (z.B. bei Disaggregation nach Altersklassen).

Leider lassen sich derartige Personenströme mit herkömmlichen Methoden nur schwer bestimmen, vor allem wenn dies in Echtzeit geschehen soll. Die Eigenschaft der differenziellen Flachheit vieler Kompartmentmodelle gestattet es, neben den epidemiologischen Zuständen auch die Personenströme u(t), welche den Rang unbekannter exogener Faktoren einnehmen, einfach und in Echtzeit zu bestimmen. Man sieht am Beispiel Israels, dass anhand von u(t) das Auftreten neuer epidemischer Wellen meist schon sehr frühzeitig erkannt werden kann:

Die folgende Abbildung zeigt links oben den Verlauf der aktiven Fallzahlen in Israel. Darauf basierend entstehen mit der Methodik der differenziellen Flachheit Schätzungen des suszeptiblen Anteils der Bevölkerung S/S_{\text{crit}} (Mitte links) sowie der aggregierten exogenen Treiber u(t), welche das epidemische Geschehen maßgeblich bestimmen (unten links). Anhand der ausgewählten Zeitpunkte 1, 1a, 2, 2a, 3 und 3a sieht man, dass anhand der exogenen Treiber und des Anteils der suszeptiblen Individuen neue epidemische Wellen schon deutlich vor deren tatsächlichem Auftreten antizipiert werden können.

Das Diagramm rechts zeigt schließlich den Zustandsverlauf in einem Phasendiagramm, welches die aktiven Fallzahlen I(t) gegen den suszeptiblen Anteil der Bevölkerung S(t)/S_{\text{crit}} darstellt:

Die effektive Reproduktionszahl

Für die Analyse der COVID-19-Epidemie wird die effektive Reproduktionszahl R_{\text{eff}} eines Landes gerne als Maß zur Beschreibung der epidemischen Aktivität herangezogen. Dabei zeigt R_{\text{eff}}>1 ansteigende Aktivität bzw. Wachstum an. Während die Bestimmung der effektiven Reproduktionszahl R_{\text{eff}} typischerweise auf statistischer Modellierung durch Faltung beruht, kann durch die Methode der differenziellen Flachheit zu jeden Zeitpunkt allein aufgrund der aktuellen Fallzahlen und deren Ableitungen eine Schätzung von R_{\text{eff}} gewonnen werden. Dadurch ist ein Zeitgewinn von ca. einer Woche zu erzielen, d.h. dass unsere Schätzung jeweils ca. eine Woche früher verfügbar ist (siehe ganz rechts im folgenden Diagramm). Dies ermöglicht eine frühzeitige Analyse der epidemischen Aktivität. In der folgenden Abbildung wird die so gewonnene Reproduktionszahl beispielhaft mit der amtlich gemeldeten Reproduktionszahl verglichen:

PROGNOSE der FALLZAHLEN

Sobald die aktuellen Zustände des epidemiologischen Modells bestimmt sind, wird der weitere Verlauf der Epidemie ausschließlich durch den zukünftigen Verlauf seiner exogenen Eingänge u(t) bestimmt. Daher können Vorhersagen über die Epidemie durch geeignete Projektionen von u(t) generiert werden, welche dafür in das Epidemiemodell eingespeist werden müssen.

Es ist zu beachten, dass eine solche Projektion der exogenen Eingänge entscheidend davon abhängt, ob etwa staatliche Interventionen im vorhergesagten Zeitintervall geändert werden oder nicht. Aufgrund des i.A. glatten Verlaufs der exogenen Eingänge gelingt jedoch eine sehr genaue Prognose der Fallzahlen über mehrere Wochen hinweg, auch eine Trendumkehr wird i.d.R. quantitativ richtig erkannt, wie man in der folgenden Abbildung sieht:

Die folgende Animation zeigt eine ex-post Validierung unserer epidemiologischen Prognosen im Verlauf des Jahres 2021:

Play Video

Prognose und Analyse nach Altersgruppen

Die folgende Analyse basiert auf einem epidemiologischen Modell mit zwei diskreten Altersgruppen und deren jeweiligen Kompartments. Gruppe 1 betrifft den Bevölkerungsanteil <65 Jahre, Gruppe 2 jenen über 65 Jahre (dies ist die durch COVID-19 bei weitem am stärksten betroffene Gruppe). Die verwendeten Datensätze (Rohdaten) basieren auf den von der Österreichischen Agentur für Gesundheit und Ernährungssicherheit bereitgestellten Daten. Die Infektionsdynamik der beiden Gruppen ist aneinander gekoppelt, d. h. die Gruppen können sich auch gegenseitig anstecken, da sie Teil derselben Bevölkerung und derselben Epidemie sind. Aufgrund der Größe der ersten Altersgruppe (fast 80% der Gesamtbevölkerung) sind die Ergebnisse für die exogenen Treiber ähnlich wie jene für die Gesamtbevölkerung. Die Ergebnisse für die zweite Altersgruppe unterscheiden sich jedoch deutlich.
Analog zum nicht-segregierten Modell können die exogenen Treiber u_1, u_2 zur Vorhersage der Epidemie herangezogen werden (gestrichelte Linien). 

HospitaliserungsrateN und Prognosen der SpitalsbelegungEN

Neben den epidemiologischen Zustandsgrößen (z.B. Zahl der suszeptiblen bzw. infizierten Individuen) stellt die Spitalsauslastung und dabei insbesondere die Auslastung der Intensivbetten (ICU) einen wichtigen Indikator dar. Diese Auslastungen folgen den eigentlichen Infektionszahlen erst mit erheblicher Verspätung, weshalb deren Prognose eine besondere Bedeutung zukommt. Die Grundlage dafür bilden genaue Prognosen der Fallzahlen einserseits (siehe dazu im Abschnitt oben) sowie eine Bestimmung bzw. Prognose der fallspezifischen Hospitalisierungs- bzw. ICU-Aufnahmeraten andererseits. Diese werden als jener Anteil der Patienten definiert die infolge einer Infektion z.B. auf die Intensivstation eingeliefert werden.

Während die fallspezifischen Aufnahmeraten meist als gegeben und über die Zeit konstant behandelt werden, können diese in unserer Methodik als stark zeitabhängig betrachtet und in Echtzeit aus den verfügbaren Daten bestimmt werden.

Insbesondere im Hinblick auf das hochdynamische Geschehen rund um COVID-19 werden fallspezifischen Aufnahmeraten durch unterschiedlichste Faktoren wie etwa Impfungen oder Mutationen stark beeinflusst. Die fallspezifischen Einweisungsraten stellen somit wichtige latente Variablen dar, die z.B. wertvolle Hinweise über den Erfolg von Impfkampagnen geben können.

Die beschriebene Methodik wurde im Februar 2022 im Journal of Nonlinear Dynamics publiziert:

C. Hametner, L. Böhler, M. Kozek, J. Bartlechner, O. Ecker, Z.P. Du, R. Kölbl,  M. Bergmann, T. Bachleitner-Hofmann, S. Jakubek
Intensive care unit occupancy predictions in the COVID-19 pandemic based on age-structured modelling and differential flatness.
Nonlinear Dynamics (2022)
https://link.springer.com/article/10.1007/s11071-022-07267-z

Die folgende Abbildung zeigt exemplarisch den zeitlichen Verlauf von fallspezifischen Einweisungsraten:

Die Belegungen von Spitälern bzw. Intensivstationen ergeben sich durch die mathematische Operation der Faltung. Zur Berechnung werden die täglichen Neuinfektionen (bzw. deren Prognosen), die fallspezifischen Aufnahmeraten sowie die zeitliche Verteilung der Aufenthalte der Patienten benutzt. Durch die dynamische Schätzung der Einweisungsraten, in Verbindung mit genauen Prognosen der Neuinfektionen mit der Methodik der differenziellen Flachheit ergeben sich in Folge vergleichsweise sehr akkurate Prognosen der Spitalsbelegungen. Dies zeigt sich sowohl in den Punktschätzungen, als auch in sehr geringen Streuungen.

Eine laufende Validierung unserer Prognose finden Sie hier:

Datenlage und verwendete Datensets

Für die durchgeführten Analysen des Infektionsgeschehens werden ausschließlich die gemeldeten Neuinfektionen benötigt. Zusätzlich werden die verabreichten Impfdosen in den einzelnen Ländern dargestellt. Die Erstellung der Prognosen der Spitalsbettenbelegung benötigt außerdem die belegten Intensiv- und Normalbetten.

Die von data.gv.at (Österreich, Ein-Altersklassen-Modell, Zwei-Altersklassen-Modell), https://www.gov.il/ (Israel, Zwei-Altersklassen-Modell), https://coronavirus.data.gov.uk/ (Großbritannien, Zwei-Altersklassen-Modell), John Hopkins Universit und WHO (restliche Länder, Ein-Altersklassen-Modell) zur Verfügung gestellten Daten bieten die Grundlage der durchgeführten Analysen.

Die geplotteten Daten der verabreichten Impfdosen wurden von data.gv.at (Österreich) und Our World In Data (restliche Länder) bezogen.

Die Daten der Intensiv- und Normalbettenbelegung wurden von data.gv.at (Österreich) bezogen.