Una stima della mortalità della variante Omicron dai dati del Sud Africa

Figura 1: Andamento dei contagi (curva blu, scala verticale di sinistra) e dei decessi (curva arancione, scala verticale di destra) in Sud Africa. Le curve sono medie mobili a 7 giorni, aggiornate fino al 3/1/2022. I contagi sono riportati con un ritardo di 13 giorni, come spiegato nel testo. La zona del picco dei contagi causato dalla variante Omicron è evidenziata in arancione

Il Sud Africa è il paese dove è stata sequenziata per la prima volta la variante Omicron ed anche il primo paese ad essere stato investito dall’ondata di casi generati da questa variante.

È quindi di grande interesse seguire l’andamento del contagio in questo paese per almeno due ottimi motivi:

  • ci permette di capire come si sviluppa l’ondata della variante Omicron
  • ci permette di avere una stima della mortalità di questa variante.

Va comunque considerato che le condizioni del Sud Africa riguardo al contagio sono profondamente diverse da quelle italiane: in Sud Africa sono effettuati circa 1/7 dei tamponi effettuati in Italia (fonte worldometers.info), ad oggi ha vaccinato il 32% della popolazione a fronte del nostro 80% (fonte OurWorldinData) ed ha una popolazione nettamente più giovane: età media di 27.6 anni a fronte nella nostra età media di 47.3 anni (fonte ONU, Population Division).

In Figura 1 riportiamo l’andamento dei casi positivi e dei decessi in Sud Africa. Ricordiamo che pubblichiamo i dati quotidiani aggiornati dei casi positivi nel mondo e dei decessi nel nostro sito, utilizzando i dati di JHU.

I casi positivi sono ritardati di 13 giorni, che è la nostra miglior stima del ritardo dei decessi rispetto ai casi positivi in Sud Africa. Il calcolo del ritardo è un argomento piuttosto delicato e lo discutiamo in una nota in fondo al post.

Ci sono due aspetti che riteniamo incoraggianti dall’andamento del contagio in Sud Africa:

  • Il picco del contagio è molto pronunciato, ma anche molto stretto, vale a dire che la crescita esponenziale della variante Omicron è molto veloce e seguita da una decrescita altrettanto veloce
  • L’ondata dei decessi dovrebbe ormai essere apparsa, ma al momento è  quasi del tutto assente. Nei due precedenti picchi di gennaio 2021 e luglio-agosto 2021 l’ondata dei decessi era in buon accordo con i casi positivi ritardati.

Dividendo il numero dei decessi per il numero dei casi positivi opportunamente ritardati si ottiene la “Case Fatality Rate”, ovvero la probabilità di decesso di un contagiato.

La Case Fatality Rate è una quantità piuttosto instabile perché dipende fortemente dall’efficacia del tracing con i tamponi, che evidentemente diminuisce al picco del contagio (causando di solito un apparente aumento della Case Fatality Rate all’aumentare dei contagi).

In Figura 2 è riportato il calcolo della Case Fatality Rate in Sud Africa, ottenuta con una semplice divisione delle due curve di Figura 1 (decessi/casi positivi ritardati di 13 giorni).

Figura 2: Case Fatality Rate (decessi su casi positivi) calcolata per il Sud Africa. In corrispondenza del picco Omicron di dicembre (zona evidenziata in arancione) la Case Fatality Rate diminuisce visibilmente.

La Case Fatality Rate in corrispondenza del picco del contagio è in forte decrescita, attualmente è  circa lo 0.4%, a fronte di valori medi precedenti superiori al 3%.

La spiegazione più semplice e più ottimistica è che la variante Omicron causi molti meno esiti gravi rispetto alle altre varianti. Un’altra possibilità potrebbe essere che il ritardo dei decessi sia aumentato di molto, e questo lo potremo verificare nei prossimi giorni.

Nota: intervallo temporale fra comparsa sintomi e decesso

L’intervallo temporale fra comparsa sintomi e decessi è oggetto di molte pubblicazioni in letteratura. Uno degli articoli più citati (qui la referenza) calcola l’intervallo studiando appena 24 casi di Covid all’inizio del contagio in Cina, interpolando una curva di ritardo parametrizzata come una distribuzione Gamma con una media μ=18.8 giorni e una dispersione  σ=8.5 giorni. Una stima più robusta di questo intervallo è calcolata per i casi italiani in questa referenza dove viene interpolata una distribuzione binomiale negativa con media  μ=16.1 giorni e una dispersione  σ=1.64 giorni. Una meta-analisi di 11 stime  pubblicate in letteratura valuta un intervallo di 16.7 giorni in questa referenza.

Queste stime sono comunque calcolate dal giorno di comparsa sintomi al giorno del decesso, mentre i dati del Sud Africa a nostra disposizione valutano la data della notifica del tampone positivo e la data della notifica del decesso. Per questo motivo abbiamo ricavato la nostra stima del ritardo confrontando un fit ai dati dei nuovi casi utilizzando distribuzioni di Gompertz con un analogo fit ai dati dei decessi. La stima di 13 giorni è la media delle differenze temporali delle posizioni dei picchi delle curve interpolate.

Sull’efficacia dei vaccini

In questo post riprendiamo un’analisi che ci è stata suggerita dal collega Prof. C. Sciacca.

L’ISS pubblica informazioni estese e dettagliate riguardo allo stato dei vaccini nei bollettini settimanali di sorveglianza integrata, disponibili in www.epicentro.iss.it .

I dati dei bollettini vengono estratti e resi disponibili in formato csv dal repository github.com/maxdevblock. Gli autori del repository, a loro volta, sviluppano analisi interessanti riguardo allo stato dei vaccini. In particolare in www.epidata.it/Italia/Vaccini_Efficacia è discussa un’analisi simile a quella che presentiamo in questo blog.

L’indicatore più efficace per stimare gli effetti dei vaccini è il rischio relativo, ovvero il rapporto della probabilità di contrarre il virus dei vaccinati rispetto a coloro che non sono ancora vaccinati, che, in statistica, vengono definiti un campione di controllo. Otteniamo questo rapporto dividendo fra di loro l’incidenza dei casi dei vaccinati rispetto all’incidenza nel campione dei non vaccinati, dove l’incidenza è il numero di casi per unità di popolazione.

Per come è definito, il rischio relativo ha il vantaggio di non dipendere dal fatto che il numero di persone vaccinate è di gran lunga maggiore di quelle non vaccinate, e di non dipendere dall’andamento del contagio (in prima approssimazione,  il rischio relativo non aumenta all’aumentare dei casi registrati).

I dati dell’ISS permettono di calcolare questo rapporto in quattro fasce di età: 12-39 anni, 40-59, 60-79 e oltre 80 anni (80+) e per quattro diversi esiti del contagio: tampone positivo, ospedalizzazione, terapia intensiva e decesso. Per un chiarimento su come ricaviamo questi dati dai bollettini dell’ISS, si veda la nota in coda a questo post.

Figura 1: Rischio relativo (in percentuale) di contrarre il contagio del campione dei vaccinati rispetto ai non vaccinati in funzione del tempo, per la fascia di età degli ultra-ottantenni. Le linee continue si riferiscono ai vaccinati con 2 dosi, quelle tratteggiate ai vaccinati con 3 dosi. In basso è riportato l’inverso della stessa quantità, ovvero il rischio di un non vaccinato rispetto ad un vaccinato. Ulteriori spiegazioni su questi grafici sono riportate  nella nota in fondo a questo post. 

L’andamento temporale del rischio relativo è riportato in Figura 1 per la fascia di età degli ultraottantenni (80+), sia per chi ha effettuato due dosi del vaccino (linee continue) che per chi ne ha effettuate tre (linee tratteggiate; la terza dose è stata somministrata a partire da novembre 2021). In Figura 2 riportiamo l’andamento del rischio relativo per le altre tre fasce di età. Nei campioni sotto gli 80 anni, fortunatamente, il numero mensile di ricoveri in terapia intensiva e dei decessi è così limitato da rendere statisticamente non significativa questa analisi, per cui non sono riportati.

Figura 2: Rischio relativo calcolato per le fasce di età 12-39 anni, 40-59 anni e 60-79 anni.

Da questi grafici si possono trarre informazioni interessanti, molte delle quali già riportate dall’ISS:

  • La protezione del vaccino è più efficace per gli esiti gravi della malattia.
  • La terza dose migliora di molto la protezione dal contagio, ad esempio un quarantenne No-Vax ha un rischio 12 volte maggiore di un vaccinato con tre dosi di essere ricoverato in ospedale per Covid. Per un ultraottantenne lo stesso rischio aumenta di 42 volte.
  • L’efficacia della protezione tende a peggiorare nel tempo. In queste curve la perdita di efficacia non è molto marcata perché nel campione dei vaccinati continuano ad entrare nuove persone, e continuano ad uscire coloro che effettuano la terza dose. L’andamento del campione non è quindi rappresentativo dell’andamento dell’efficacia del vaccino nella singola persona nel tempo.
  • Le curve di probabilità delle terze dosi mostrano chiaramente che sono necessarie due settimane per ottenere la protezione completa dal vaccino. Questo effetto non è tanto visibile nel campione delle seconde dosi perchè alla data di inizio del grafico (14 luglio) le seconde dosi erano già iniziate da quasi sei mesi, e quindi nel campione non c’erano solamente vaccinati da pochi giorni (qui l’andamento delle dosi giornaliere del vaccino come riportato dal nostro sito).
  • Con grafici di questo, tipo sarà possibile verificare l’efficacia dei vaccini contro la variante Omicron.

Infine, in Figura 3 sono riportate, in funzione del tempo, le incidenze (in unità di casi mensili per milione di abitanti) per i tamponi positivi, le ospedalizzazioni, le terapie intensive e i decessi calcolate per i non vaccinati e per chi ha avuto una, due o tre dosi, ottenute sommando assieme tutte le fasce di età

Figura 3: Incidenza, in unità di casi rilevati in 30 giorni per 1 milione di abitanti per non vaccinati e vaccinati con 1, 2 e 3 dosi nei campioni di Tamponi positivi, Ospedalizzati, ingressi in Terapie Intensive e Decessi.

Nota: I dati dei bollettini dell’ISS.

I bollettini dell’ISS si succedono a cadenza settimanale, ma riportano i dati complessivi degli ultimi 30 giorni. I dati degli ultimi 15 giorni raccolti non sono consolidati, per cui variano nei bollettini successivi. Questo rende impossibile estrarre i dati settimanali dai bollettini ISS, per cui i dati che noi mostriamo sono sommati su 30 giorni e riportati al 15°  giorno dell’intervallo. Come conseguenza, i singoli punti sono correlati fra di loro (due dati successivi hanno in comune 23 giorni). Va anche notato che a causa del consolidamento dei dati, i totali complessivi (somme dei casi su tutto l’arco temporale) riportati in ogni bollettino non corrispondono alla somma dei dati mensili riportati nei bollettini precedenti.

Nello stesso bollettino settimanale, i dati dei positivi, ospedalizzati, terapie intensive e decessi sono calcolati in tre intervalli temporali diversi. I positivi sono calcolati nei 30 giorni che terminano alla data nominale del bollettino. Ospedalizzati e terapie intensive sono calcolati in un intervallo di 30 giorni che termina 14 giorni prima della data nominale (7 giorni prima nei bollettini dal 14 luglio al 23 novembre); i decessi, infine, sono calcolati in un intervallo che termina 21 giorni prima della data nominale. Nei nostri grafici riportiamo tutti i campioni con le date corrette.

Anche le normalizzazioni alla popolazione dei vaccinati, necessarie per un corretto calcolo delle incidenze, sono calcolate con i valori del corretto periodo per ogni campione.

Per quanto riguarda il conteggio di ospedalizzati, terapie intensive e decessi, riportiamo la nota dell’ISS: “Ospedalizzazioni, ricoveri in terapia intensiva e decessi qui riportati riferiscono al periodo della diagnosi per tener conto del tempo necessario all’aggravamento dopo la diagnosi e del ritardo di notifica”. Va notato infine che qui le ospedalizzazioni sono gli ingressi in ospedale, non il totale delle persone ricoverate come riportato nei dati della protezione civile.

Per ulteriori chiarimenti sui dati ISS, si veda la nostra pagina web.

I dati dell’ISS in nostro possesso, riportati settimanalmente nel nostro sito web, non contengono le informazioni dello stato vaccinale nei vari casi.

Indicatori di ripartenze (parte seconda)

In questa seconda parte applicheremo le tecniche introdotte nella prima parte del post alla seconda ondata del contagio.

Il grafico qui sopra mostra l’evoluzione del contagio (nuovi casi giornalieri) in Italia a partire dal 1 Ottobre 2020 fino ad oggi. 

È subito evidente che l’andamento negli ultimi 8 mesi è molto più complesso del periodo precedente: almeno 4 ondate si sono susseguite in questo periodo.  Per descrivere l’andamento dei nuovi casi giornalieri utilizziamo la somma di 4 funzioni di Gompertz (una per ogni ondata).  Nel grafico sono riportate le singole curve tratteggiate (curve G1, G2, G3, G4), mentre la loro somma è la curva continua arancione (G1+G2+G3+G4),  infine in grigio è riportata la media mobile a 7 giorni, per confronto.

Come abbiamo discusso nel dettaglio nel post “Quanto vale(va) un rosso”, questo andamento a ondate multiple è dovuto al fatto che le misure restrittive non sono state costanti nel tempo e sono state applicate in tempi diversi nelle varie regioni. La decrescita finale è sostanzialmente dovuta all’effetto delle vaccinazioni , che hanno  rapidamente smorzato la ripartenza rappresentata dalla quarta Gompertz (G4).

Per segnalare eventuali ripartenze fermiamo quindi l’interpolazione dei dati all’11 maggio (data alla quale l’interpolazione  si stabilizza, incorporando la curva G4) e monitoriamo eventuali discostamenti dall’estrapolazione.

Nel sito aggiorniamo quotidianamente l’andamento del contagio (qui il link) e l’andamento dei residui (in questa pagina web) che riportiamo qui sotto.

Come si può facilmente osservare, per il momento, fortunatamente, non sono visibili accenni di ripartenza del contagio.

È possibile controllare lo stesso andamento nelle singole regioni selezionando il menu “Grafici”, la regione desiderata in “Regioni” e poi “Dati=Positivi” e “Positivi=Deviazione”, come mostrato qui sotto. Anche  a livello regionale non sono visibili indicazioni di ripartenze.

Possiamo ripetere lo stesso esercizio per i dati del Regno Unito, di cui abbiamo discusso in questo post.

Il grafico qui sopra mostra l’andamento del contagio nella seconda ondata, abbiamo interpolato i dati con 4 Gompertz fino alla data del 20 Aprile.

I residui ((dati-fit)/errore dei dati), riportati nel grafico sottostante, mostrano che i dati hanno cominciato a discostarsi dal fit a partire dall’inizio di maggio:  al 26 di maggio avevano superato la soglia di allarme di due deviazioni standard, mentre i media hanno cominciato a segnalare la ripartenza in UK solo verso il 10 giugno…

Indicatori di ripartenze (parte prima)

Nella fase di decrescita dei contagi è senz’altro interessante, nella speranza di non vedere alcun risultato, costruire degli indicatori che permettano di segnalare una possibile ripartenza del contagio. In questo post illustreremo una tecnica che abbiamo già utilizzato con successo durante la prima ondata.

Abbiamo illustrato, in post  precedenti (Rt nelle Province, Rt nelle Regioni,I dati su cui viene calcolato Rt, Un mistero svelato, Una fotografia precisa, Inferenza Bayesiana, Quanto Valeva un Rosso), numerose caratteristiche dell’indicatore Rt che è anche molto efficace nell’ indicare la ripartenza o lo spegnimento del contagio (qui le nostre pagine su Rt nazionale, Rt nelle regioni e Rt nelle province e nel mondo).

In questo post descriveremo invece dei metodi specificatamente costruiti per seguire la ripartenza dopo la prima ondata, in un secondo post descriveremo come questi metodi possono essere applicati alla situazione attuale.

Il grafico qui sopra, aggiornato quotidianamente sul nostro sito nella primavera-estate dell’anno scorso, mostra l’andamento del contagio in Italia durante la primavera 2020 e la interpolazione dei dati con 5 diverse curve asimmetriche (ovvero con la velocità di discesa diversa da quella di salita, per confronto è riportata anche  una gaussiana simmetrica). Le curve erano interpolate utilizzando i  dati fino al 4 maggio 2020, data in cui il primo lockdown è stato rilasciato, e successivamente sono state estrapolate per capire se i dati giornalieri rimanevano in accordo con l’andamento  del contagio durante il lockdown. La convoluzione delle 5 curve definisce una sorta di regione di accettanza entro cui i dati sarebbero dovuti rimanere se l’andamento del contagio fosse rimasto quello previsto.

In questo modo è stato possibile fare una previsione sul valore dei contagi al 18 maggio (effettuata il 4 maggio), sulla data di raggiungimento di 200 casi quotidiani, ed è stato possibile visualizzare che a partire da circa l’1 luglio 2020 i dati hanno cominciato a discostarsi dalla banda di previsione (e quindi l’andamento durante il lockdown è stato mantenuto per circa due mesi dopo le riaperture, dal 4 maggio ai primi di luglio).

Vale la pena di sottolineare come una singola curva sia in grado di rappresentare in modo soddisfacente l’andamento dei dati dall’inizio del contagio fino ai primi di luglio: un periodo di oltre cinque mesi. Nel caso della Gompertz sono quindi sufficienti tre soli parametri per descrivere il contagio in questo periodo di tempo. D’altra parte tutto questo funziona finchè non intervengono fatti nuovi a modificare l’andamento del contagio. Cambiamenti che questo metodo non è in grado di prevedere, come  non è in grado di prevedere  cosa possa succedere  una volta che il contagio si sia discostato dall’andamento previsto dalla curva.

Nel plot sottostante invece di riportare le curve interpolanti sovrapposte ai dati, viene riportata la distanza dei nuovi casi giornalieri dalle previsioni di due curve, le derivate della Gompertz e della Logistica generalizzata. La distanza è divisa per l’errore del dato, calcolato tenendo conto degli errori statistici (poissoniani) e sistematici (dispersione dei dati dovuta ad esempio al minor numero di tamponi durante i weekend).

 

Il grafico riporta quindi una zona verde e una zona gialla che corrispondono alle bande di errori corrispondenti a 1 sigma e 2 sigma (67% e  95% di livello di confidenza). Questa rappresentazione è molto più efficace nel mostrare che i dati hanno cominciato a discostarsi dalle previsioni a partire circa dal 1 Luglio e che già all’inizio di Agosto erano inconciliabili con l’andamento durante il lockdown.

Questa ripartenza non ha destato grandi preoccupazioni a livello generale perchè la risalita estiva non è stata violenta. Il regime esponenziale con tempi di raddoppio inferiori ai 10 giorni ha cominciato a manifestarsi a partire dal 1 Ottobre, generando la cosidetta seconda ondata.

Il grafico qui sotto mostra l’andamento del contagio fino al 1 Ottobre 2020 (la curva sovraimposta è la media mobile a 7 giorni). Cosa è successo nella seconda ondata è argomento della seconda parte di questo post.

 

Quanto vale(va) un rosso?

 

Abbiamo valutato  quale valore di Rt tendenziale producevano le misure restrittive chiamate “giallo”, “arancione” e “rosso” entrate in vigore nelle regioni italiane dal 6 Novembre 2020.

Il risultato finale è riportato nel grafico qui sopra: i quadratini indicano l’Rt tendenziale in 9 regioni italiane (le più popolose) e nella loro combinazione (chiamata un po’ impropriamente Italia).

Si nota per esempio che in media in Italia le misure restrittive gialle producevano un Rt pari a 1.09, le arancioni Rt=0.97 e le rosse Rt=0.86.

Considerando che solo i valori di Rt minori di 1 producono un contenimento del contagio, risulta che le misure gialle erano inadeguate al contenimento, le arancioni erano pericolosamente vicine al valore critico Rt=1 e solo le misure rosse garantivano un contenimento del contagio. Questo fino al 26 aprile 2021, successivamente il progressivo aumento delle persone vaccinate ha procurato un deciso miglioramento del contenimento del contagio. Dal grafico si nota anche che le diverse regioni italiane avevano risposte diverse alle stesse misure restrittive.

La procedura intrapresa per ottenere questo risultato è riportata nell’articolo “Study on the e ffects of the restrictive measures for containment of the COVID-19 pandemic on the reproduction number Rt in Italian regions” che abbiamo sottomesso a pubblicazione: https://arxiv.org/abs/2106.02603

A grandi linee la procedura è la seguente:

Siamo partiti dalla definizione delle misure restrittive nelle regioni italiane dal 6 Novembre 2020 al 26 Aprile 2021:

abbiamo selezionato le 9 regioni italiane con più di 3 milioni di abitanti (per poter calcolare Rt con minori fluttuazioni statistiche) e abbiamo seguito l’andamento di Rt nei periodi in cui le misure restrittive rimanevano costanti nelle regioni.

Sono stati introdotti tre diversi modelli per riprodurre l’andamento di Rt, il modello che riproduce meglio i dati introduce un valore tendenziale di Rt per ognuna delle tre misure restrittive. Per poter seguire correttamente l’andamento di Rt abbiamo dovuto calcolare il ritardo con cui un cambiamento di misure restrittive produce cambiamenti rivelabili, questo ritardo risulta essere pari complessivamente a 15 giorni.

Nella figura sottostante riportiamo l’andamento di Rt nelle 9 regioni considerate, rappresentati da pallini colorati in giallo, arancione e rosso in accordo con le misure restrittive adottate, tenuto conto del ritardo che abbiamo misurato. Nei plot le linee continue azzurre riportano i valori stimati dal nostro modello (ad ogni cambio di colore il valore stimato di Rt viene definito uguale al valore misurato).

Da questi plot si può osservare che i cambiamenti delle misure restrittive non erano sempre coerenti con l’andamento del contagio. Si nota anche che spesso a misure restrittive costanti l’andamento di Rt rimaneva costante (si veda per esempio la Campania dal 20 Gennaio 2021 al 1 Marzo 2021). Infine il nostro modello non è in grado di riprodurre correttamente tutti gli andamenti di Rt. Va tuttavia considerato che il nostro obiettivo era misurare la tendenza di Rt prodotta dalle misure restrittive, e non abbiamo considerato molti altri fattori che influiscono sull’andamento del contagio, quali le misure di tracciamento e screening dei contagi con i tamponi, la gestione delle chiusure delle scuole nelle diverse regioni, tutte le ulteriori misure restrittive introdotte nelle singole regioni in base a decisioni locali, la diversa mobilita’ nelle varie regioni e gli effetti dei vaccini e delle varianti.

A partire da gennaio 2021 sono cominciate le vaccinazioni sul territorio italiano e si e’ diffusa la variante inglese del virus. Questi due importanti effetti in linea di principio dovrebbero avere effetti opposti sull’efficacia delle misure restrittive. Al 26 Aprile 2021 circa il 20% della popolazione italiana aveva ricevuto almeno la prima dose del vaccino, mentre la variante inglese rappresentava piu’ del 90% dei contagi.

Per valutare l’effetto combinato dei vaccini e della variante abbiamo  calcolato i valori tendenziali di Rt in due periodi di tempo distinti: prima e dopo il 15 Gennaio 2021.

Quello che abbiamo osservato è che l’effetto combinato dei vaccini e delle varianti è stato un  peggioramento dell’efficacia delle misure restrittive dopo il 15 gennaio, valutato in circa il 15% in termini di Rt tendenziale.

Fortunatamente dopo il 26 aprile la variante inglese non poteva fare danni ulteriori, avendo già raggiunto praticamente il 100% dei contagiati, mentre i vaccinati  sono diventanti sempre più numerosi, procurando il vistoso miglioramento dell’andamento dei contagi osservato dalla fine di aprile ad oggi.

Davvero la mortalità in Italia per Covid-19 è la peggiore del mondo?

 

(Quick answer: no, con le opportune correzioni siamo al 20mo posto fra le 42 nazioni con più casi di Covid-19 al mondo)

La mortalità è definita come decessi per Covid-19 divisi per la popolazione totale.
A prima vista l’Italia è fra le peggiori nazioni al mondo, come risulta dal grafico sottostante dove riportiamo la mortalità in funzione dei casi totali per 100000 abitanti per le 42 nazioni con più casi di Covid-19 al mondo.

Continua a leggere