Stima del tasso di mortalità da COVID-19

In questi giorni viene discusso con enfasi e preoccupazione il problema del presunto alto valore del tasso di mortalità da Covid in Italia.

Per tasso di mortalità da Covid si intende la probabilità di morte di un contagiato, in letteratura questa quantità viene chiamata “Case Fatality Rate” o “CFR”.

Abbiamo già discusso in un precedente post come la mortalità assoluta da Covid (numero totale di morti da Covid per unità di popolazione) in Italia, sia elevata in valori assoluti, ma in realtà risulti in linea con i valori medi internazionali una volta che venga corretta per la diversa e sfavorevole distribuzione di età che caratterizza la nostra popolazione.

La Case Fatality Rate (CFR da ora in poi), è una quantità più complessa e delicata da calcolare rispetto alla mortalità assoluta. In questo post cercheremo di mettere in luce la procedura per il suo calcolo e confrontare i valori italiani con quelli delle principali nazioni europee.

Il grafico della distribuzione dei morti giornalieri da Covid si ottiene dal prodotto di tre distribuzioni (figura sottostante): la distribuzione dei Casi Positivi giornalieri moltiplicata per la distribuzione di probabilità dell’intervallo temporale tra il momento in cui si effettua il tampone e l’eventuale successivo decesso (che è responsabile del “ritardo” con cui l’andamento dei decessi si manifesta rispetto all’andamento dei casi positivi) e moltiplicata infine per il valore di CFR, che come vedremo non è costante nel tempo.


La CFR può quindi essere estratta eseguendo la procedura inversa, ossia dividendo la distribuzione dei decessi per il prodotto della distribuzione dei casi positivi con l’intervallo temporale tamponi-decessi (ttd nel seguito). Questa procedura inversa, di estrazione di una distribuzione dal prodotto di diverse componenti si chiama “unfolding”.

Mentre i casi positivi e i decessi possono essere estratti dai dati della Protezione Civile, la distribuzione di ttd deve essere calcolata in quest’altro modo, utilizzando quindi la tecnica di unfolding.

Le procedure di unfolding sono molto comuni nella fisica delle alte energie e in molte altre discipline scientifiche, pur essendo moderatamente complesse. Con queste metodologie è possibile estrarre le caratteristiche di una funzione che collega due distribuzioni note (nel nostro caso la distribuzione dei casi positivi e la distribuzione dei decessi). La sola ipotesi introdotta è che ttd  sia distribuita come una funzione gamma (ipotesi molto comune ed ampiamente utilizzata in letteratura). Con questo metodo possiamo calcolare la distribuzione di ttd per ogni singola nazione, procedura necessaria perché in linea  di principio questa distribuzione può variare da nazione a nazione. Il lettore interessato puo’ documentarsi sulle tecniche di unfolding con l’articolo di rassegna [1].

Con questi ingredienti siamo quindi in grado di estrarre l’andamento della CFR in Italia negli ultimi mesi:

La figura, in scala logaritmica, mostra chiaramente gli effetti della vaccinazione (è da notare che un vaccino “perfetto”, ugualmente efficace nell’evitare il contagio e nell’evitare i decessi ,non avrebbe effetti visibili in questo grafico), che ha inizialmente diminuito la mortalità di un fattore 5; della variante delta, che l’ha quasi raddoppiata; della variante Omicron, che l’ha infine diminuita di un fattore 3 in sole due settimane (l’andamento della CFR in SudAfrica alla comparsa della variante Omicron ci aveva permesso di prevedere in anticipo questa decrescita, come discusso in questo post). Nelle ultime settimane la CFR è in costante lenta decrescita, con valori attuali intorno al due per mille (due decessi per mille contagi riportati), il valore più basso riportato dall’inizio dell’epidemia.

A questo punto è molto istruttivo osservare cosa è successo nel Regno Unito e in Danimarca

A prima vista si potrebbe temere che una nuova variante Covid ad alta mortalità si sia diffusa nel Nord Europa negli ultimi mesi. In realtà la netta risalita visibile in UK e Danimarca, che a lungo sono state le nazioni più virtuose per qualità e quantità di testing, è dovuta alla loro recente drastica diminuzione proprio dell’attività di testing. Abbiamo già visto come la CFR sia ottenuta dal rapporto decessi/casi positivi, per cui una diminuzione dell’attività di testing, che porta ad una diminuzione dei casi positivi rilevati (sostanzialmente gli asintomatici non sono più riportati nelle statistiche) provoca un rialzo dell’ andamento di CFR anche in assenza di una aumentata mortalità.

Questi andamenti dimostrano come un corretto confronto tra diversi valori di CFR richieda una correzione per le diverse procedure di testing, che può avere effetti importanti ma che è piuttosto complicata da formalizzare in un algoritmo.

La ridotta capacità di testing è anche il principale motivo per cui la CFR in Italia all’inizio del contagio superava il 2%.

A questo punto possiamo confrontare gli andamenti italiani con le altre maggiori nazioni europee: Francia, Germania e Spagna.

I grafici di cui sopra sono piuttosto simili all’andamento italiano e non evidenziano affatto una anomalia italiana rispetto alle altre nazioni europee.

Da sottolineare che andrebbe applicata una terza importante correzione al calcolo di CFR: quella per la diversa distribuzione di età della popolazione italiana, soprattutto rispetto a Francia e Spagna, che sono nazioni significativamente più “giovani”, in media, della nostra.

CONCLUSIONI

Il calcolo della mortalità da Covid, o CFR, è complesso e delicato. Al meglio delle nostre competenze i valori che calcoliamo non mostrano anomalie nell’andamento, nè evidenziano significative discrepanze dei valori italiani da quelli delle altre nazioni europee.

NOTE BIBLIOGRAFICHE

[1] Schmitt, A., Data Unfolding Methods in High Energy Physics, https://doi.org/10.1051/epjconf/201713711008

Attenzione, la “discesa” sembra finita

L’ondata Omicron è stata importante sia per il numero di contagiati (circa 8 milioni di persone), che per la rapidità di crescita che è passata da circa 20 mila nuovi positivi al giorno di metà dicembre, agli oltre 200 mila di inizio gennaio.

Fortunatamente, in maniera quasi altrettanto veloce, verso la fine di gennaio è iniziata una decrescita che ci aveva fatto sperare che quest’ondata si sarebbe conclusa verso la fine di febbraio. Purtroppo ad un certo punto il meccanismo di discesa si è inceppato e la decrescita è stata sempre più lenta. Qui sotto vedete il grafico dei positivi giornalieri con due curve sovrapposte: quella gialla è una derivata della funzione Gompertz, mentre quella blu è la media mobile (su una settimana) dei conteggi. Abbiamo discusso in precedenti post (primo post, secondo post) come la funzione Gompertz sia in grado di descrivere precisamente la fase di discesa della curva dei contagi fino all’insorgere di nuove ondate.

La curva gialla è stata ottenuta usando i dati fino al 22 febbraio, dopo di che è stata estrapolata. Come si vede dalla figura (nella zona evidenziata in arancione), in queste 2 ultime settimane l’andamento dei casi ha smesso di seguire la fase di discesa e mostra i sintomi di una ricrescita.

Questa inversione di tendenza è molto visibile anche dal grafico  dell’indice di contagio Rt visibile qui sotto (metodo Covidstat, ripreso dalla pagina dedicata del nostro sito).

Rt è sceso sotto il valore 1 il 24 gennaio ed ha proseguito una veloce discesa fino alla metà di febbraio raggiungendo il valore minimo 0.69, per poi però iniziare a salire e sfiorare 0.9 in questi giorni. E’ probabile che nei prossimi giorni Rt continui a salire anche oltre il valore 1 e di conseguenza i positivi giornalieri aumenteranno. Il motivo di questa crescita non è chiaro e potrebbe non essere unico: un contributo potrebbe derivare dal basso numero di bambini vaccinati nella fascia 5-12 anni (circa il 35%), oppure dal calo di misure restrittive, o dalle frontiere più aperte, … tante possibili concause.

La cosa importante è accorgersi quanto prima (e questo è il motivo fondamentale di fare l’analisi dei dati) che stiamo entrando in un’altra fase e dunque ci dobbiamo preparare a fronteggiarla con gli interventi opportuni (distanziamento, mascherine, vaccini, …). Terminiamo con una nota di ottimismo: l’arrivo della primavera porterà temperature più alte e ci spingerà a passare più tempo in luoghi aperti dove minore è la probabilità di contagio.

Una stima della mortalità della variante Omicron dai dati del Sud Africa

Figura 1: Andamento dei contagi (curva blu, scala verticale di sinistra) e dei decessi (curva arancione, scala verticale di destra) in Sud Africa. Le curve sono medie mobili a 7 giorni, aggiornate fino al 3/1/2022. I contagi sono riportati con un ritardo di 13 giorni, come spiegato nel testo. La zona del picco dei contagi causato dalla variante Omicron è evidenziata in arancione

Il Sud Africa è il paese dove è stata sequenziata per la prima volta la variante Omicron ed anche il primo paese ad essere stato investito dall’ondata di casi generati da questa variante.

È quindi di grande interesse seguire l’andamento del contagio in questo paese per almeno due ottimi motivi:

  • ci permette di capire come si sviluppa l’ondata della variante Omicron
  • ci permette di avere una stima della mortalità di questa variante.

Va comunque considerato che le condizioni del Sud Africa riguardo al contagio sono profondamente diverse da quelle italiane: in Sud Africa sono effettuati circa 1/7 dei tamponi effettuati in Italia (fonte worldometers.info), ad oggi ha vaccinato il 32% della popolazione a fronte del nostro 80% (fonte OurWorldinData) ed ha una popolazione nettamente più giovane: età media di 27.6 anni a fronte nella nostra età media di 47.3 anni (fonte ONU, Population Division).

In Figura 1 riportiamo l’andamento dei casi positivi e dei decessi in Sud Africa. Ricordiamo che pubblichiamo i dati quotidiani aggiornati dei casi positivi nel mondo e dei decessi nel nostro sito, utilizzando i dati di JHU.

I casi positivi sono ritardati di 13 giorni, che è la nostra miglior stima del ritardo dei decessi rispetto ai casi positivi in Sud Africa. Il calcolo del ritardo è un argomento piuttosto delicato e lo discutiamo in una nota in fondo al post.

Ci sono due aspetti che riteniamo incoraggianti dall’andamento del contagio in Sud Africa:

  • Il picco del contagio è molto pronunciato, ma anche molto stretto, vale a dire che la crescita esponenziale della variante Omicron è molto veloce e seguita da una decrescita altrettanto veloce
  • L’ondata dei decessi dovrebbe ormai essere apparsa, ma al momento è  quasi del tutto assente. Nei due precedenti picchi di gennaio 2021 e luglio-agosto 2021 l’ondata dei decessi era in buon accordo con i casi positivi ritardati.

Dividendo il numero dei decessi per il numero dei casi positivi opportunamente ritardati si ottiene la “Case Fatality Rate”, ovvero la probabilità di decesso di un contagiato.

La Case Fatality Rate è una quantità piuttosto instabile perché dipende fortemente dall’efficacia del tracing con i tamponi, che evidentemente diminuisce al picco del contagio (causando di solito un apparente aumento della Case Fatality Rate all’aumentare dei contagi).

In Figura 2 è riportato il calcolo della Case Fatality Rate in Sud Africa, ottenuta con una semplice divisione delle due curve di Figura 1 (decessi/casi positivi ritardati di 13 giorni).

Figura 2: Case Fatality Rate (decessi su casi positivi) calcolata per il Sud Africa. In corrispondenza del picco Omicron di dicembre (zona evidenziata in arancione) la Case Fatality Rate diminuisce visibilmente.

La Case Fatality Rate in corrispondenza del picco del contagio è in forte decrescita, attualmente è  circa lo 0.4%, a fronte di valori medi precedenti superiori al 3%.

La spiegazione più semplice e più ottimistica è che la variante Omicron causi molti meno esiti gravi rispetto alle altre varianti. Un’altra possibilità potrebbe essere che il ritardo dei decessi sia aumentato di molto, e questo lo potremo verificare nei prossimi giorni.

Nota: intervallo temporale fra comparsa sintomi e decesso

L’intervallo temporale fra comparsa sintomi e decessi è oggetto di molte pubblicazioni in letteratura. Uno degli articoli più citati (qui la referenza) calcola l’intervallo studiando appena 24 casi di Covid all’inizio del contagio in Cina, interpolando una curva di ritardo parametrizzata come una distribuzione Gamma con una media μ=18.8 giorni e una dispersione  σ=8.5 giorni. Una stima più robusta di questo intervallo è calcolata per i casi italiani in questa referenza dove viene interpolata una distribuzione binomiale negativa con media  μ=16.1 giorni e una dispersione  σ=1.64 giorni. Una meta-analisi di 11 stime  pubblicate in letteratura valuta un intervallo di 16.7 giorni in questa referenza.

Queste stime sono comunque calcolate dal giorno di comparsa sintomi al giorno del decesso, mentre i dati del Sud Africa a nostra disposizione valutano la data della notifica del tampone positivo e la data della notifica del decesso. Per questo motivo abbiamo ricavato la nostra stima del ritardo confrontando un fit ai dati dei nuovi casi utilizzando distribuzioni di Gompertz con un analogo fit ai dati dei decessi. La stima di 13 giorni è la media delle differenze temporali delle posizioni dei picchi delle curve interpolate.

Sull’efficacia dei vaccini

In questo post riprendiamo un’analisi che ci è stata suggerita dal collega Prof. C. Sciacca.

L’ISS pubblica informazioni estese e dettagliate riguardo allo stato dei vaccini nei bollettini settimanali di sorveglianza integrata, disponibili in www.epicentro.iss.it .

I dati dei bollettini vengono estratti e resi disponibili in formato csv dal repository github.com/maxdevblock. Gli autori del repository, a loro volta, sviluppano analisi interessanti riguardo allo stato dei vaccini. In particolare in www.epidata.it/Italia/Vaccini_Efficacia è discussa un’analisi simile a quella che presentiamo in questo blog.

L’indicatore più efficace per stimare gli effetti dei vaccini è il rischio relativo, ovvero il rapporto della probabilità di contrarre il virus dei vaccinati rispetto a coloro che non sono ancora vaccinati, che, in statistica, vengono definiti un campione di controllo. Otteniamo questo rapporto dividendo fra di loro l’incidenza dei casi dei vaccinati rispetto all’incidenza nel campione dei non vaccinati, dove l’incidenza è il numero di casi per unità di popolazione.

Per come è definito, il rischio relativo ha il vantaggio di non dipendere dal fatto che il numero di persone vaccinate è di gran lunga maggiore di quelle non vaccinate, e di non dipendere dall’andamento del contagio (in prima approssimazione,  il rischio relativo non aumenta all’aumentare dei casi registrati).

I dati dell’ISS permettono di calcolare questo rapporto in quattro fasce di età: 12-39 anni, 40-59, 60-79 e oltre 80 anni (80+) e per quattro diversi esiti del contagio: tampone positivo, ospedalizzazione, terapia intensiva e decesso. Per un chiarimento su come ricaviamo questi dati dai bollettini dell’ISS, si veda la nota in coda a questo post.

Figura 1: Rischio relativo (in percentuale) di contrarre il contagio del campione dei vaccinati rispetto ai non vaccinati in funzione del tempo, per la fascia di età degli ultra-ottantenni. Le linee continue si riferiscono ai vaccinati con 2 dosi, quelle tratteggiate ai vaccinati con 3 dosi. In basso è riportato l’inverso della stessa quantità, ovvero il rischio di un non vaccinato rispetto ad un vaccinato. Ulteriori spiegazioni su questi grafici sono riportate  nella nota in fondo a questo post. 

L’andamento temporale del rischio relativo è riportato in Figura 1 per la fascia di età degli ultraottantenni (80+), sia per chi ha effettuato due dosi del vaccino (linee continue) che per chi ne ha effettuate tre (linee tratteggiate; la terza dose è stata somministrata a partire da novembre 2021). In Figura 2 riportiamo l’andamento del rischio relativo per le altre tre fasce di età. Nei campioni sotto gli 80 anni, fortunatamente, il numero mensile di ricoveri in terapia intensiva e dei decessi è così limitato da rendere statisticamente non significativa questa analisi, per cui non sono riportati.

Figura 2: Rischio relativo calcolato per le fasce di età 12-39 anni, 40-59 anni e 60-79 anni.

Da questi grafici si possono trarre informazioni interessanti, molte delle quali già riportate dall’ISS:

  • La protezione del vaccino è più efficace per gli esiti gravi della malattia.
  • La terza dose migliora di molto la protezione dal contagio, ad esempio un quarantenne No-Vax ha un rischio 12 volte maggiore di un vaccinato con tre dosi di essere ricoverato in ospedale per Covid. Per un ultraottantenne lo stesso rischio aumenta di 42 volte.
  • L’efficacia della protezione tende a peggiorare nel tempo. In queste curve la perdita di efficacia non è molto marcata perché nel campione dei vaccinati continuano ad entrare nuove persone, e continuano ad uscire coloro che effettuano la terza dose. L’andamento del campione non è quindi rappresentativo dell’andamento dell’efficacia del vaccino nella singola persona nel tempo.
  • Le curve di probabilità delle terze dosi mostrano chiaramente che sono necessarie due settimane per ottenere la protezione completa dal vaccino. Questo effetto non è tanto visibile nel campione delle seconde dosi perchè alla data di inizio del grafico (14 luglio) le seconde dosi erano già iniziate da quasi sei mesi, e quindi nel campione non c’erano solamente vaccinati da pochi giorni (qui l’andamento delle dosi giornaliere del vaccino come riportato dal nostro sito).
  • Con grafici di questo, tipo sarà possibile verificare l’efficacia dei vaccini contro la variante Omicron.

Infine, in Figura 3 sono riportate, in funzione del tempo, le incidenze (in unità di casi mensili per milione di abitanti) per i tamponi positivi, le ospedalizzazioni, le terapie intensive e i decessi calcolate per i non vaccinati e per chi ha avuto una, due o tre dosi, ottenute sommando assieme tutte le fasce di età

Figura 3: Incidenza, in unità di casi rilevati in 30 giorni per 1 milione di abitanti per non vaccinati e vaccinati con 1, 2 e 3 dosi nei campioni di Tamponi positivi, Ospedalizzati, ingressi in Terapie Intensive e Decessi.

Nota: I dati dei bollettini dell’ISS.

I bollettini dell’ISS si succedono a cadenza settimanale, ma riportano i dati complessivi degli ultimi 30 giorni. I dati degli ultimi 15 giorni raccolti non sono consolidati, per cui variano nei bollettini successivi. Questo rende impossibile estrarre i dati settimanali dai bollettini ISS, per cui i dati che noi mostriamo sono sommati su 30 giorni e riportati al 15°  giorno dell’intervallo. Come conseguenza, i singoli punti sono correlati fra di loro (due dati successivi hanno in comune 23 giorni). Va anche notato che a causa del consolidamento dei dati, i totali complessivi (somme dei casi su tutto l’arco temporale) riportati in ogni bollettino non corrispondono alla somma dei dati mensili riportati nei bollettini precedenti.

Nello stesso bollettino settimanale, i dati dei positivi, ospedalizzati, terapie intensive e decessi sono calcolati in tre intervalli temporali diversi. I positivi sono calcolati nei 30 giorni che terminano alla data nominale del bollettino. Ospedalizzati e terapie intensive sono calcolati in un intervallo di 30 giorni che termina 14 giorni prima della data nominale (7 giorni prima nei bollettini dal 14 luglio al 23 novembre); i decessi, infine, sono calcolati in un intervallo che termina 21 giorni prima della data nominale. Nei nostri grafici riportiamo tutti i campioni con le date corrette.

Anche le normalizzazioni alla popolazione dei vaccinati, necessarie per un corretto calcolo delle incidenze, sono calcolate con i valori del corretto periodo per ogni campione.

Per quanto riguarda il conteggio di ospedalizzati, terapie intensive e decessi, riportiamo la nota dell’ISS: “Ospedalizzazioni, ricoveri in terapia intensiva e decessi qui riportati riferiscono al periodo della diagnosi per tener conto del tempo necessario all’aggravamento dopo la diagnosi e del ritardo di notifica”. Va notato infine che qui le ospedalizzazioni sono gli ingressi in ospedale, non il totale delle persone ricoverate come riportato nei dati della protezione civile.

Per ulteriori chiarimenti sui dati ISS, si veda la nostra pagina web.

I dati dell’ISS in nostro possesso, riportati settimanalmente nel nostro sito web, non contengono le informazioni dello stato vaccinale nei vari casi.

Definita la capienza massima di cinema, teatri e stadi

Pochi giorni fa è stata ridefinita la capienza massima per cinema e teatri all’80% e per gli stadi al 75%. Sono numeri che lasciano perplessi, ma il problema è che a meravigliarsi è la matematica. Lo scopo è chiarissimo: far ripartire le attività cercando comunque di proteggersi dal contagio; il problema è che per combattere in maniera seria il covid è necessario proteggere tutte le persone allo stesso modo. Riempire teatri e cinema all’80% significa occupare 4 posti e tenerne 1 libero.

Considerando le persone vicine come quelle alla propria destra, sinistra, davanti e dietro, si vede (1° figura) che la metà delle persone ha 4 persone vicine (nessun distanziamento), mentre l’altra metà ne ha 2 vicine (“distanziamento parziale”). La situazione non cambia considerando i soli posti a destra e sinistra (nell’ipotesi di un cinema o teatro con file molto distanti tra loro): ci saranno la metà delle persone con posti occupati a destra e sinistra (nessun distanziamento) e l’altra metà con un solo posto occupato (“distanziamento parziale”). La situazione è più fortunata per gli spettatori seduti ai bordi di ogni fila che hanno sempre un lato libero. Comunque, in qualsiasi modo disponiate il 20% di posti vuoti, non troverete un risultato migliore. Se si vuole distanziare tutte le persone allo stesso modo, la matematica non ammette mezze misure e la capienza deve essere inferiore o al massimo uguale al 50%.

Nella 2° figura, la struttura è riempita al 50% e ogni persona ha vicino a se un posto libero (sia che si consideri solo le file o anche le colonne). Per gli stadi il discorso è ancora peggiore, riempire al 75% significa occupare 3 posti e lasciarne libero 1 e anche in questo caso non ci sarà nessun spettatore distanziato completamente dagli altri. Distanziare in maniera uguale le persone significa ridurre la capienza di un fattore 2, 4, 8 … (cioè ridurre i posti al 50%, 25%, 12,5% …) a seconda di quanto si vuole allontanare le persone tra loro, mentre in questo caso di è deciso di ridurre di 1/4 (cioè al 75%) e 1/5 (all’80%) che è sicuramente utile per far ripartire un settore, ma poco utile come contromisura per il covid.

Concludiamo: questa volta il legislatore ha voluto proteggere solo su base statistica e non tutta la popolazione, a questo punto non ci resta che andare a qualche spettacolo e sperare di essere vicino ad uno dei posti liberi, oppure, piccolo consiglio, andate un po’ in anticipo e occupate i posti laterali!!!

 

“CovidStat va all’Istituto Superiore di Sanità”

Alla fine di marzo 2021 è stato siglato un accordo tra l’INFN e l’Istituto Superiore di Sanità (ISS) che consente all’INFN di utilizzare i dati dell’ISS per analisi statistiche. Queste informazioni sono di proprietà del ISS e l’accordo non prevede la possibilità da parte dell’INFN di rendere “aperti” questi dati.

Il dataset, comunque soggetto ad alcune limitazioni relative alla privacy, viene aggiornato con cadenza settimanale e contiene informazioni aggiuntive rispetto a quelle fornite dalla Protezione Civile. Dal 21 aprile 2021 sono cominciati ad arrivare i dati ed abbiamo iniziato ad analizzarli, realizzando i grafici che, per problemi di privacy, sono stati resi disponibili nel sito solo dal 17 luglio 2021: https://covid19.infn.it/iss/.

Ma cosa contengono questi grafici?
Oltre ad essere più precisi in termini di datazione dei casi (le date non sono affette dal ritardo di notifica), contengono informazioni aggiuntive relative all’età, al genere e al personale sanitario.

Vediamo, per esempio, i nuovi casi giornalieri per operatori sanitari e le altre categorie persone:

Ma allora i vaccini funzionano? Caspita se funzionano !!
Il calo dei casi sintomatici per gli operatori sanitari durante i primi mesi del 2021 dimostra l’effetto della campagna di vaccinazione.

E questo si riflette anche sul numero di decessi degli ultra-ottantenni, come è mostrato chiaramente in figura:

 

Ma si ammalano di più le femmine o i maschi?
Non abbiamo notato alcuna differenza perchè la leggera prevalenza dei casi sintomatici delle femmine (2 132 779 casi) rispetto ai casi dei maschi (2 042 281) è esattamente compensata dal maggior numero di femmine nella popolazione italiana (51%, corrispondente a 30 591 392 su 59 641 488 individui). Il rapporto di casi positivi, infatti, normalizzato alla corrispondente popolazione viene uguale al 7% in entrambi i generi.
E in questa figura viene mostrata la distribuzione per età dei casi positivi:

Cosa possiamo dire dell’età alla quale si contrae la malattia?
Vi è una generale tendenza alla diminuzione dell’età media degli ammalati per COVID-19. Questo significa che le persone più anziane, che sono la percentuale più alta di persone vaccinate, sviluppano sempre di meno la malattia. Al contrario dei giovani che sono ora la categoria più esposta al rischio di contagio, anche a causa della loro vita di relazione sociale più intensa.
In questo grafico è riportato l’andamento temporale dell’età mediana e gli intervalli corrispondenti ai quantili al 68% e 95% dei casi positivi:

Ad esempio, il giorno 26 giugno 2021 il valore della mediana dell’età dei casi positivi era 35 anni.

Fino a che livello di dettaglio arrivano i dati?
I dati dei positivi, ricoveri, terapia intensiva e deceduti  sono disponibili fino al livello delle province. Di queste informazioni, che sono affette da una maggior fluttuazione statistica rispetto alle regioni e al dato nazionale, viene riportato solo l’andamento della media mobile a 7 giorni e non il dato giornaliero. La scelta di utilizzare le distribuzioni mediate è motivata anche dal fatto di rispettare le limitazioni relative alla privacy. Nella figura sottostante viene visualizzata la distribuzione dei deceduti giornalieri per la provincia di Milano:

e, per paragone, la stessa distribuzione per la provincia di Napoli:

È evidente il diverso impatto che hanno avuto la prima e la seconda ondata della pandemia nelle due province considerate.

Ma perché è stato condotto questo tipo di analisi, non era sufficiente il bollettino del ISS?
Le analisi compiute dal gruppo CovidStat (sui dati dell’ISS) permettono di avere una visione diversa e complementare rispetto a quelle compiute dal ISS. L’ISS produce un bollettino settimanale (reperibile nel sito https://www.epicentro.iss.it/coronavirus/) dove sono analizzati diversi aspetti epidemiologici e medici della pandemia dovuta al Covid-19. Nel nostro sito, invece, viene compiuta una analisi che è di tipo statistico e vengono resi disponibili i grafici, dove la statistica lo consente, per tutte le regioni e province. Per questo i due approcci sono complementari. Con l’aggiornamento settimanale, inoltre, vengono ricalcolate e graficate tutte le quantita` di tutte le province e di tutte le regioni.

In conclusione, in questo blog vi abbiamo commentato alcuni grafici, ma più che con immagini statiche vi invitiamo a visitare il nostro sito che offre la possibilità di avere maggiori informazioni interattive.

La ripartenza

In Italia la ripartenza dei contagi appare ormai statisticamente evidente. Il risultato lo riportiamo con un aggiornamento quotidiano in questa pagina web.

Si evidenzia una discrepanza che supera di dieci volte la fascia di errore corrispondente ad una deviazione standard, diventando quindi statisticamente significativa. Questo aumento si osserva sistematicamente in molte delle regioni italiane, in maniera più marcata al Nord.

Rispetto a luglio dell’anno scorso, la ripartenza sembra essere più rapida, e parte da circa 1000 contagi al giorno, mentre l’anno scorso era ripartita da circa 100 nuovi positivi giornalieri.

Per il momento, il nostro metodo non permette di prevedere come evolverà la ripartenza.

Va sottolineato che ad un aumento dei contagi potrebbe non seguire un aumento altrettanto importante di ricoverati e di decessi grazie alla maggiore protezione offerta dai vaccini, come osservato nel Regno Unito ed in Israele.

Il metodo utilizzato

In due precedenti post nel nostro blog ([1], [2]) avevamo descritto gli indicatori messi a punto per avere informazioni sulla ripartenza dell’infezione, in particolare a causa del rischio dovuto alla variante delta (“indiana”).

Nel secondo articolo, in particolare, avevamo descritto come si calcolano i residui, che usiamo come indicatore di una possibile ripartenza, e come si interpreta il grafico dell’andamento nel tempo dei residui, riportato qui sotto:

Nel grafico erano evidenti due effetti ancora da correggere, per i quali abbiamo introdotto una nuova procedura che qui descriviamo:

  • resta evidente una modulazione settimanale dovuta al calo del numero di tamponi e conseguentemente di casi che vengono normalmente riportati in occasione dei fine settimana;
  • al diminuire del numero dei casi, la banda di oscillazione dei residui sembra smorzarsi, sintomo di una possibile sottostima delle incertezze.

Per tenere conto di questi effetti, abbiamo applicato due correzioni:

  • per rimuovere la modulazione settimanale, abbiamo utilizzato due possibili approcci, entrambi riportati sul nostro sito:
    1. al posto del numero dei casi giornalieri, abbiamo utilizzato la media mobile a sette giorni, che elimina la modulazione settimanale, fornendo però una risposta meno rapida a fronte di un possibile aumento;
    2. come alternativa, abbiamo introdotto sette fattori correttivi, uno per ciascun giorno della settimana, determinati in maniera tale che, mediati su tutti i giorni usati per calcolare l’interpolazione del nostro modello, il numero di contagi, corretto per questi fattori, risulti costante per tutti e sette giorni della settimana.
  • lo smorzamento della banda di oscillazione è dovuto all’assunzione iniziale che le incertezze derivassero da una distribuzione di Poisson, quindi che ad un numero di conteggi n corrispondesse un’incertezza proporzionale a √n, che avevamo però corretto riscalando queste incertezze per un fattore fisso. Questa non è necessariamente la stima più accurata delle incertezze, per cui abbiamo introdotto un modello più realistico del loro andamento come somma in quadratura di un termine poissoniano, √n, e di una incertezza proporzionale al numero dei conteggi, il cui fattore di proporzionalità abbiamo stimato dai dati stessi pari al 10% del numero di conteggi.

Con queste correzioni, il grafico dei residui è quello che appare all’inizio di questo post, dove non è più presente la modulazione settimanale, e viene aumentata notevolmente la sensibilità con un numero relativamente basso di positivi, come avviene negli ultimi giorni.

Il risultato degli ultimi giorni evidenzia una discrepanza che supera di dieci volte la fascia di errore corrispondente ad una deviazione standard, diventando quindi significativamente discrepante rispetto al modello di discesa che abbiamo interpolato. Questo aumento si osserva sistematicamente in molte delle regioni italiane, in particolare al Nord.

Indicatori di ripartenze (parte seconda)

In questa seconda parte applicheremo le tecniche introdotte nella prima parte del post alla seconda ondata del contagio.

Il grafico qui sopra mostra l’evoluzione del contagio (nuovi casi giornalieri) in Italia a partire dal 1 Ottobre 2020 fino ad oggi. 

È subito evidente che l’andamento negli ultimi 8 mesi è molto più complesso del periodo precedente: almeno 4 ondate si sono susseguite in questo periodo.  Per descrivere l’andamento dei nuovi casi giornalieri utilizziamo la somma di 4 funzioni di Gompertz (una per ogni ondata).  Nel grafico sono riportate le singole curve tratteggiate (curve G1, G2, G3, G4), mentre la loro somma è la curva continua arancione (G1+G2+G3+G4),  infine in grigio è riportata la media mobile a 7 giorni, per confronto.

Come abbiamo discusso nel dettaglio nel post “Quanto vale(va) un rosso”, questo andamento a ondate multiple è dovuto al fatto che le misure restrittive non sono state costanti nel tempo e sono state applicate in tempi diversi nelle varie regioni. La decrescita finale è sostanzialmente dovuta all’effetto delle vaccinazioni , che hanno  rapidamente smorzato la ripartenza rappresentata dalla quarta Gompertz (G4).

Per segnalare eventuali ripartenze fermiamo quindi l’interpolazione dei dati all’11 maggio (data alla quale l’interpolazione  si stabilizza, incorporando la curva G4) e monitoriamo eventuali discostamenti dall’estrapolazione.

Nel sito aggiorniamo quotidianamente l’andamento del contagio (qui il link) e l’andamento dei residui (in questa pagina web) che riportiamo qui sotto.

Come si può facilmente osservare, per il momento, fortunatamente, non sono visibili accenni di ripartenza del contagio.

È possibile controllare lo stesso andamento nelle singole regioni selezionando il menu “Grafici”, la regione desiderata in “Regioni” e poi “Dati=Positivi” e “Positivi=Deviazione”, come mostrato qui sotto. Anche  a livello regionale non sono visibili indicazioni di ripartenze.

Possiamo ripetere lo stesso esercizio per i dati del Regno Unito, di cui abbiamo discusso in questo post.

Il grafico qui sopra mostra l’andamento del contagio nella seconda ondata, abbiamo interpolato i dati con 4 Gompertz fino alla data del 20 Aprile.

I residui ((dati-fit)/errore dei dati), riportati nel grafico sottostante, mostrano che i dati hanno cominciato a discostarsi dal fit a partire dall’inizio di maggio:  al 26 di maggio avevano superato la soglia di allarme di due deviazioni standard, mentre i media hanno cominciato a segnalare la ripartenza in UK solo verso il 10 giugno…

Indicatori di ripartenze (parte prima)

Nella fase di decrescita dei contagi è senz’altro interessante, nella speranza di non vedere alcun risultato, costruire degli indicatori che permettano di segnalare una possibile ripartenza del contagio. In questo post illustreremo una tecnica che abbiamo già utilizzato con successo durante la prima ondata.

Abbiamo illustrato, in post  precedenti (Rt nelle Province, Rt nelle Regioni,I dati su cui viene calcolato Rt, Un mistero svelato, Una fotografia precisa, Inferenza Bayesiana, Quanto Valeva un Rosso), numerose caratteristiche dell’indicatore Rt che è anche molto efficace nell’ indicare la ripartenza o lo spegnimento del contagio (qui le nostre pagine su Rt nazionale, Rt nelle regioni e Rt nelle province e nel mondo).

In questo post descriveremo invece dei metodi specificatamente costruiti per seguire la ripartenza dopo la prima ondata, in un secondo post descriveremo come questi metodi possono essere applicati alla situazione attuale.

Il grafico qui sopra, aggiornato quotidianamente sul nostro sito nella primavera-estate dell’anno scorso, mostra l’andamento del contagio in Italia durante la primavera 2020 e la interpolazione dei dati con 5 diverse curve asimmetriche (ovvero con la velocità di discesa diversa da quella di salita, per confronto è riportata anche  una gaussiana simmetrica). Le curve erano interpolate utilizzando i  dati fino al 4 maggio 2020, data in cui il primo lockdown è stato rilasciato, e successivamente sono state estrapolate per capire se i dati giornalieri rimanevano in accordo con l’andamento  del contagio durante il lockdown. La convoluzione delle 5 curve definisce una sorta di regione di accettanza entro cui i dati sarebbero dovuti rimanere se l’andamento del contagio fosse rimasto quello previsto.

In questo modo è stato possibile fare una previsione sul valore dei contagi al 18 maggio (effettuata il 4 maggio), sulla data di raggiungimento di 200 casi quotidiani, ed è stato possibile visualizzare che a partire da circa l’1 luglio 2020 i dati hanno cominciato a discostarsi dalla banda di previsione (e quindi l’andamento durante il lockdown è stato mantenuto per circa due mesi dopo le riaperture, dal 4 maggio ai primi di luglio).

Vale la pena di sottolineare come una singola curva sia in grado di rappresentare in modo soddisfacente l’andamento dei dati dall’inizio del contagio fino ai primi di luglio: un periodo di oltre cinque mesi. Nel caso della Gompertz sono quindi sufficienti tre soli parametri per descrivere il contagio in questo periodo di tempo. D’altra parte tutto questo funziona finchè non intervengono fatti nuovi a modificare l’andamento del contagio. Cambiamenti che questo metodo non è in grado di prevedere, come  non è in grado di prevedere  cosa possa succedere  una volta che il contagio si sia discostato dall’andamento previsto dalla curva.

Nel plot sottostante invece di riportare le curve interpolanti sovrapposte ai dati, viene riportata la distanza dei nuovi casi giornalieri dalle previsioni di due curve, le derivate della Gompertz e della Logistica generalizzata. La distanza è divisa per l’errore del dato, calcolato tenendo conto degli errori statistici (poissoniani) e sistematici (dispersione dei dati dovuta ad esempio al minor numero di tamponi durante i weekend).

 

Il grafico riporta quindi una zona verde e una zona gialla che corrispondono alle bande di errori corrispondenti a 1 sigma e 2 sigma (67% e  95% di livello di confidenza). Questa rappresentazione è molto più efficace nel mostrare che i dati hanno cominciato a discostarsi dalle previsioni a partire circa dal 1 Luglio e che già all’inizio di Agosto erano inconciliabili con l’andamento durante il lockdown.

Questa ripartenza non ha destato grandi preoccupazioni a livello generale perchè la risalita estiva non è stata violenta. Il regime esponenziale con tempi di raddoppio inferiori ai 10 giorni ha cominciato a manifestarsi a partire dal 1 Ottobre, generando la cosidetta seconda ondata.

Il grafico qui sotto mostra l’andamento del contagio fino al 1 Ottobre 2020 (la curva sovraimposta è la media mobile a 7 giorni). Cosa è successo nella seconda ondata è argomento della seconda parte di questo post.

 

Attenzione!!!!

In Italia e in generale nel mondo, siamo in un periodo favorevole, ogni giorno sono vaccinate milioni di persone e l’arrivo dell’estate, almeno nel nostro emisfero, dovrebbe aiutare il processo di regressione del contagio. In questo panorama positivo c’è però un aspetto preoccupante: a fianco potete vedere il grafico del numero di positivi giornalieri del Regno Unito (media mobile a 7 giorni) dall’inizio della pandemia ad oggi. Nel grafico sono ben visibili i picchi del 2020 in aprile e novembre e il successivo del gennaio 2021. Per uscire dall’emergenza dell’ultimo picco, il Regno Unito attivò due mesi di lockdown e una campagna vaccinale piuttosto consistente che ridusse i contagi giornalieri da 60000 a meno di 2000. Questo miglioramento ha portato una drastica riduzione delle misure restrittive e la vita ha ripreso in maniera quasi regolare. Purtroppo negli ultimi 20 giorni (vedi riquadro rosso) il numero di positivi giornalieri è costantemente aumentato arrivando a circa 6000. Questa crescita ha un andamento esponenziale, con un tempo di raddoppio di 15 giorni nella prima parte e di 9 nella seconda: il significato è chiaro, se continuerà così, ogni 9 giorni il numero dei positivi raddoppierà. Questo aumento comporta anche una crescita dell’indicatore Rt che è arrivato a 1.4. Tuttavia l’aumento dei positivi non porta necessariamente ad un aumento dei decessi, in quanto potrebbe trattarsi soprattutto di contagi su persone giovani non ancora vaccinate che tipicamente sopravvivono alla malattia (purtroppo non abbiamo i dati per verificarlo). Attualmente il numero di decessi in UK mostra un andamento costante che potrebbe anche essere dovuto al picco di contagi negli ultimi mesi. La domanda ovvia è: perché in un panorama generalmente positivo, il Regno Unito sta peggiorando? Non c’è una risposta certa, ma solo ipotesi:

  • Il Regno Unito ha deciso di ritardare la somministrazione della seconda dose, oltre ai limiti suggeriti dai produttori dei vaccini, per poter garantire la somministrazione della prima dose alla maggior parte possibile della popolazione. Questa scelta potrebbe avere ridotto l’efficacia del vaccino. Ad oggi in UK sono stati vaccinati il 61.1% della popolazione con almeno la prima dose e il 43.6% con la seconda (qui il sito UK delle vaccinazioni). Per confronto in Italia ad oggi queste percentuali sono rispettivamente 47.1% e 21.2% (vedi la nostra pagina web sulle vaccinazioni)
  • il vaccino (la gran parte delle somministrazioni è avvenuta con Astra Zeneca) potrebbe non essere completamente efficace contro la variante indiana presente nel Regno Unito; (qui il bollettino ISS con la situazione delle varianti in Italia, aggiornata all’11 Giugno)
  • le misure restrittive sono troppo deboli per contrastare la diffusione del virus nelle persone non ancora vaccinate;

Al momento in Italia niente lascia presagire una crescita, ma uno sguardo a chi ci sta vicino ci deve far capire che non siamo ancora usciti dalla pandemia ed è fondamentale continuare a mantenere quelle misure di prudenza personale (mascherine, distanziamento, lavaggio mani, …) specie adesso che stiamo andando verso una notevole riduzione delle misure restrittive.