La ripartenza

In Italia la ripartenza dei contagi appare ormai statisticamente evidente. Il risultato lo riportiamo con un aggiornamento quotidiano in questa pagina web.

Si evidenzia una discrepanza che supera di dieci volte la fascia di errore corrispondente ad una deviazione standard, diventando quindi statisticamente significativa. Questo aumento si osserva sistematicamente in molte delle regioni italiane, in maniera più marcata al Nord.

Rispetto a luglio dell’anno scorso, la ripartenza sembra essere più rapida, e parte da circa 1000 contagi al giorno, mentre l’anno scorso era ripartita da circa 100 nuovi positivi giornalieri.

Per il momento, il nostro metodo non permette di prevedere come evolverà la ripartenza.

Va sottolineato che ad un aumento dei contagi potrebbe non seguire un aumento altrettanto importante di ricoverati e di decessi grazie alla maggiore protezione offerta dai vaccini, come osservato nel Regno Unito ed in Israele.

Il metodo utilizzato

In due precedenti post nel nostro blog ([1], [2]) avevamo descritto gli indicatori messi a punto per avere informazioni sulla ripartenza dell’infezione, in particolare a causa del rischio dovuto alla variante delta (“indiana”).

Nel secondo articolo, in particolare, avevamo descritto come si calcolano i residui, che usiamo come indicatore di una possibile ripartenza, e come si interpreta il grafico dell’andamento nel tempo dei residui, riportato qui sotto:

Nel grafico erano evidenti due effetti ancora da correggere, per i quali abbiamo introdotto una nuova procedura che qui descriviamo:

  • resta evidente una modulazione settimanale dovuta al calo del numero di tamponi e conseguentemente di casi che vengono normalmente riportati in occasione dei fine settimana;
  • al diminuire del numero dei casi, la banda di oscillazione dei residui sembra smorzarsi, sintomo di una possibile sottostima delle incertezze.

Per tenere conto di questi effetti, abbiamo applicato due correzioni:

  • per rimuovere la modulazione settimanale, abbiamo utilizzato due possibili approcci, entrambi riportati sul nostro sito:
    1. al posto del numero dei casi giornalieri, abbiamo utilizzato la media mobile a sette giorni, che elimina la modulazione settimanale, fornendo però una risposta meno rapida a fronte di un possibile aumento;
    2. come alternativa, abbiamo introdotto sette fattori correttivi, uno per ciascun giorno della settimana, determinati in maniera tale che, mediati su tutti i giorni usati per calcolare l’interpolazione del nostro modello, il numero di contagi, corretto per questi fattori, risulti costante per tutti e sette giorni della settimana.
  • lo smorzamento della banda di oscillazione è dovuto all’assunzione iniziale che le incertezze derivassero da una distribuzione di Poisson, quindi che ad un numero di conteggi n corrispondesse un’incertezza proporzionale a √n, che avevamo però corretto riscalando queste incertezze per un fattore fisso. Questa non è necessariamente la stima più accurata delle incertezze, per cui abbiamo introdotto un modello più realistico del loro andamento come somma in quadratura di un termine poissoniano, √n, e di una incertezza proporzionale al numero dei conteggi, il cui fattore di proporzionalità abbiamo stimato dai dati stessi pari al 10% del numero di conteggi.

Con queste correzioni, il grafico dei residui è quello che appare all’inizio di questo post, dove non è più presente la modulazione settimanale, e viene aumentata notevolmente la sensibilità con un numero relativamente basso di positivi, come avviene negli ultimi giorni.

Il risultato degli ultimi giorni evidenzia una discrepanza che supera di dieci volte la fascia di errore corrispondente ad una deviazione standard, diventando quindi significativamente discrepante rispetto al modello di discesa che abbiamo interpolato. Questo aumento si osserva sistematicamente in molte delle regioni italiane, in particolare al Nord.

Indicatori di ripartenze (parte seconda)

In questa seconda parte applicheremo le tecniche introdotte nella prima parte del post alla seconda ondata del contagio.

Il grafico qui sopra mostra l’evoluzione del contagio (nuovi casi giornalieri) in Italia a partire dal 1 Ottobre 2020 fino ad oggi. 

È subito evidente che l’andamento negli ultimi 8 mesi è molto più complesso del periodo precedente: almeno 4 ondate si sono susseguite in questo periodo.  Per descrivere l’andamento dei nuovi casi giornalieri utilizziamo la somma di 4 funzioni di Gompertz (una per ogni ondata).  Nel grafico sono riportate le singole curve tratteggiate (curve G1, G2, G3, G4), mentre la loro somma è la curva continua arancione (G1+G2+G3+G4),  infine in grigio è riportata la media mobile a 7 giorni, per confronto.

Come abbiamo discusso nel dettaglio nel post “Quanto vale(va) un rosso”, questo andamento a ondate multiple è dovuto al fatto che le misure restrittive non sono state costanti nel tempo e sono state applicate in tempi diversi nelle varie regioni. La decrescita finale è sostanzialmente dovuta all’effetto delle vaccinazioni , che hanno  rapidamente smorzato la ripartenza rappresentata dalla quarta Gompertz (G4).

Per segnalare eventuali ripartenze fermiamo quindi l’interpolazione dei dati all’11 maggio (data alla quale l’interpolazione  si stabilizza, incorporando la curva G4) e monitoriamo eventuali discostamenti dall’estrapolazione.

Nel sito aggiorniamo quotidianamente l’andamento del contagio (qui il link) e l’andamento dei residui (in questa pagina web) che riportiamo qui sotto.

Come si può facilmente osservare, per il momento, fortunatamente, non sono visibili accenni di ripartenza del contagio.

È possibile controllare lo stesso andamento nelle singole regioni selezionando il menu “Grafici”, la regione desiderata in “Regioni” e poi “Dati=Positivi” e “Positivi=Deviazione”, come mostrato qui sotto. Anche  a livello regionale non sono visibili indicazioni di ripartenze.

Possiamo ripetere lo stesso esercizio per i dati del Regno Unito, di cui abbiamo discusso in questo post.

Il grafico qui sopra mostra l’andamento del contagio nella seconda ondata, abbiamo interpolato i dati con 4 Gompertz fino alla data del 20 Aprile.

I residui ((dati-fit)/errore dei dati), riportati nel grafico sottostante, mostrano che i dati hanno cominciato a discostarsi dal fit a partire dall’inizio di maggio:  al 26 di maggio avevano superato la soglia di allarme di due deviazioni standard, mentre i media hanno cominciato a segnalare la ripartenza in UK solo verso il 10 giugno…

Indicatori di ripartenze (parte prima)

Nella fase di decrescita dei contagi è senz’altro interessante, nella speranza di non vedere alcun risultato, costruire degli indicatori che permettano di segnalare una possibile ripartenza del contagio. In questo post illustreremo una tecnica che abbiamo già utilizzato con successo durante la prima ondata.

Abbiamo illustrato, in post  precedenti (Rt nelle Province, Rt nelle Regioni,I dati su cui viene calcolato Rt, Un mistero svelato, Una fotografia precisa, Inferenza Bayesiana, Quanto Valeva un Rosso), numerose caratteristiche dell’indicatore Rt che è anche molto efficace nell’ indicare la ripartenza o lo spegnimento del contagio (qui le nostre pagine su Rt nazionale, Rt nelle regioni e Rt nelle province e nel mondo).

In questo post descriveremo invece dei metodi specificatamente costruiti per seguire la ripartenza dopo la prima ondata, in un secondo post descriveremo come questi metodi possono essere applicati alla situazione attuale.

Il grafico qui sopra, aggiornato quotidianamente sul nostro sito nella primavera-estate dell’anno scorso, mostra l’andamento del contagio in Italia durante la primavera 2020 e la interpolazione dei dati con 5 diverse curve asimmetriche (ovvero con la velocità di discesa diversa da quella di salita, per confronto è riportata anche  una gaussiana simmetrica). Le curve erano interpolate utilizzando i  dati fino al 4 maggio 2020, data in cui il primo lockdown è stato rilasciato, e successivamente sono state estrapolate per capire se i dati giornalieri rimanevano in accordo con l’andamento  del contagio durante il lockdown. La convoluzione delle 5 curve definisce una sorta di regione di accettanza entro cui i dati sarebbero dovuti rimanere se l’andamento del contagio fosse rimasto quello previsto.

In questo modo è stato possibile fare una previsione sul valore dei contagi al 18 maggio (effettuata il 4 maggio), sulla data di raggiungimento di 200 casi quotidiani, ed è stato possibile visualizzare che a partire da circa l’1 luglio 2020 i dati hanno cominciato a discostarsi dalla banda di previsione (e quindi l’andamento durante il lockdown è stato mantenuto per circa due mesi dopo le riaperture, dal 4 maggio ai primi di luglio).

Vale la pena di sottolineare come una singola curva sia in grado di rappresentare in modo soddisfacente l’andamento dei dati dall’inizio del contagio fino ai primi di luglio: un periodo di oltre cinque mesi. Nel caso della Gompertz sono quindi sufficienti tre soli parametri per descrivere il contagio in questo periodo di tempo. D’altra parte tutto questo funziona finchè non intervengono fatti nuovi a modificare l’andamento del contagio. Cambiamenti che questo metodo non è in grado di prevedere, come  non è in grado di prevedere  cosa possa succedere  una volta che il contagio si sia discostato dall’andamento previsto dalla curva.

Nel plot sottostante invece di riportare le curve interpolanti sovrapposte ai dati, viene riportata la distanza dei nuovi casi giornalieri dalle previsioni di due curve, le derivate della Gompertz e della Logistica generalizzata. La distanza è divisa per l’errore del dato, calcolato tenendo conto degli errori statistici (poissoniani) e sistematici (dispersione dei dati dovuta ad esempio al minor numero di tamponi durante i weekend).

 

Il grafico riporta quindi una zona verde e una zona gialla che corrispondono alle bande di errori corrispondenti a 1 sigma e 2 sigma (67% e  95% di livello di confidenza). Questa rappresentazione è molto più efficace nel mostrare che i dati hanno cominciato a discostarsi dalle previsioni a partire circa dal 1 Luglio e che già all’inizio di Agosto erano inconciliabili con l’andamento durante il lockdown.

Questa ripartenza non ha destato grandi preoccupazioni a livello generale perchè la risalita estiva non è stata violenta. Il regime esponenziale con tempi di raddoppio inferiori ai 10 giorni ha cominciato a manifestarsi a partire dal 1 Ottobre, generando la cosidetta seconda ondata.

Il grafico qui sotto mostra l’andamento del contagio fino al 1 Ottobre 2020 (la curva sovraimposta è la media mobile a 7 giorni). Cosa è successo nella seconda ondata è argomento della seconda parte di questo post.

 

Attenzione!!!!

In Italia e in generale nel mondo, siamo in un periodo favorevole, ogni giorno sono vaccinate milioni di persone e l’arrivo dell’estate, almeno nel nostro emisfero, dovrebbe aiutare il processo di regressione del contagio. In questo panorama positivo c’è però un aspetto preoccupante: a fianco potete vedere il grafico del numero di positivi giornalieri del Regno Unito (media mobile a 7 giorni) dall’inizio della pandemia ad oggi. Nel grafico sono ben visibili i picchi del 2020 in aprile e novembre e il successivo del gennaio 2021. Per uscire dall’emergenza dell’ultimo picco, il Regno Unito attivò due mesi di lockdown e una campagna vaccinale piuttosto consistente che ridusse i contagi giornalieri da 60000 a meno di 2000. Questo miglioramento ha portato una drastica riduzione delle misure restrittive e la vita ha ripreso in maniera quasi regolare. Purtroppo negli ultimi 20 giorni (vedi riquadro rosso) il numero di positivi giornalieri è costantemente aumentato arrivando a circa 6000. Questa crescita ha un andamento esponenziale, con un tempo di raddoppio di 15 giorni nella prima parte e di 9 nella seconda: il significato è chiaro, se continuerà così, ogni 9 giorni il numero dei positivi raddoppierà. Questo aumento comporta anche una crescita dell’indicatore Rt che è arrivato a 1.4. Tuttavia l’aumento dei positivi non porta necessariamente ad un aumento dei decessi, in quanto potrebbe trattarsi soprattutto di contagi su persone giovani non ancora vaccinate che tipicamente sopravvivono alla malattia (purtroppo non abbiamo i dati per verificarlo). Attualmente il numero di decessi in UK mostra un andamento costante che potrebbe anche essere dovuto al picco di contagi negli ultimi mesi. La domanda ovvia è: perché in un panorama generalmente positivo, il Regno Unito sta peggiorando? Non c’è una risposta certa, ma solo ipotesi:

  • Il Regno Unito ha deciso di ritardare la somministrazione della seconda dose, oltre ai limiti suggeriti dai produttori dei vaccini, per poter garantire la somministrazione della prima dose alla maggior parte possibile della popolazione. Questa scelta potrebbe avere ridotto l’efficacia del vaccino. Ad oggi in UK sono stati vaccinati il 61.1% della popolazione con almeno la prima dose e il 43.6% con la seconda (qui il sito UK delle vaccinazioni). Per confronto in Italia ad oggi queste percentuali sono rispettivamente 47.1% e 21.2% (vedi la nostra pagina web sulle vaccinazioni)
  • il vaccino (la gran parte delle somministrazioni è avvenuta con Astra Zeneca) potrebbe non essere completamente efficace contro la variante indiana presente nel Regno Unito; (qui il bollettino ISS con la situazione delle varianti in Italia, aggiornata all’11 Giugno)
  • le misure restrittive sono troppo deboli per contrastare la diffusione del virus nelle persone non ancora vaccinate;

Al momento in Italia niente lascia presagire una crescita, ma uno sguardo a chi ci sta vicino ci deve far capire che non siamo ancora usciti dalla pandemia ed è fondamentale continuare a mantenere quelle misure di prudenza personale (mascherine, distanziamento, lavaggio mani, …) specie adesso che stiamo andando verso una notevole riduzione delle misure restrittive.

Quanto vale(va) un rosso?

 

Abbiamo valutato  quale valore di Rt tendenziale producevano le misure restrittive chiamate “giallo”, “arancione” e “rosso” entrate in vigore nelle regioni italiane dal 6 Novembre 2020.

Il risultato finale è riportato nel grafico qui sopra: i quadratini indicano l’Rt tendenziale in 9 regioni italiane (le più popolose) e nella loro combinazione (chiamata un po’ impropriamente Italia).

Si nota per esempio che in media in Italia le misure restrittive gialle producevano un Rt pari a 1.09, le arancioni Rt=0.97 e le rosse Rt=0.86.

Considerando che solo i valori di Rt minori di 1 producono un contenimento del contagio, risulta che le misure gialle erano inadeguate al contenimento, le arancioni erano pericolosamente vicine al valore critico Rt=1 e solo le misure rosse garantivano un contenimento del contagio. Questo fino al 26 aprile 2021, successivamente il progressivo aumento delle persone vaccinate ha procurato un deciso miglioramento del contenimento del contagio. Dal grafico si nota anche che le diverse regioni italiane avevano risposte diverse alle stesse misure restrittive.

La procedura intrapresa per ottenere questo risultato è riportata nell’articolo “Study on the e ffects of the restrictive measures for containment of the COVID-19 pandemic on the reproduction number Rt in Italian regions” che abbiamo sottomesso a pubblicazione: https://arxiv.org/abs/2106.02603

A grandi linee la procedura è la seguente:

Siamo partiti dalla definizione delle misure restrittive nelle regioni italiane dal 6 Novembre 2020 al 26 Aprile 2021:

abbiamo selezionato le 9 regioni italiane con più di 3 milioni di abitanti (per poter calcolare Rt con minori fluttuazioni statistiche) e abbiamo seguito l’andamento di Rt nei periodi in cui le misure restrittive rimanevano costanti nelle regioni.

Sono stati introdotti tre diversi modelli per riprodurre l’andamento di Rt, il modello che riproduce meglio i dati introduce un valore tendenziale di Rt per ognuna delle tre misure restrittive. Per poter seguire correttamente l’andamento di Rt abbiamo dovuto calcolare il ritardo con cui un cambiamento di misure restrittive produce cambiamenti rivelabili, questo ritardo risulta essere pari complessivamente a 15 giorni.

Nella figura sottostante riportiamo l’andamento di Rt nelle 9 regioni considerate, rappresentati da pallini colorati in giallo, arancione e rosso in accordo con le misure restrittive adottate, tenuto conto del ritardo che abbiamo misurato. Nei plot le linee continue azzurre riportano i valori stimati dal nostro modello (ad ogni cambio di colore il valore stimato di Rt viene definito uguale al valore misurato).

Da questi plot si può osservare che i cambiamenti delle misure restrittive non erano sempre coerenti con l’andamento del contagio. Si nota anche che spesso a misure restrittive costanti l’andamento di Rt rimaneva costante (si veda per esempio la Campania dal 20 Gennaio 2021 al 1 Marzo 2021). Infine il nostro modello non è in grado di riprodurre correttamente tutti gli andamenti di Rt. Va tuttavia considerato che il nostro obiettivo era misurare la tendenza di Rt prodotta dalle misure restrittive, e non abbiamo considerato molti altri fattori che influiscono sull’andamento del contagio, quali le misure di tracciamento e screening dei contagi con i tamponi, la gestione delle chiusure delle scuole nelle diverse regioni, tutte le ulteriori misure restrittive introdotte nelle singole regioni in base a decisioni locali, la diversa mobilita’ nelle varie regioni e gli effetti dei vaccini e delle varianti.

A partire da gennaio 2021 sono cominciate le vaccinazioni sul territorio italiano e si e’ diffusa la variante inglese del virus. Questi due importanti effetti in linea di principio dovrebbero avere effetti opposti sull’efficacia delle misure restrittive. Al 26 Aprile 2021 circa il 20% della popolazione italiana aveva ricevuto almeno la prima dose del vaccino, mentre la variante inglese rappresentava piu’ del 90% dei contagi.

Per valutare l’effetto combinato dei vaccini e della variante abbiamo  calcolato i valori tendenziali di Rt in due periodi di tempo distinti: prima e dopo il 15 Gennaio 2021.

Quello che abbiamo osservato è che l’effetto combinato dei vaccini e delle varianti è stato un  peggioramento dell’efficacia delle misure restrittive dopo il 15 gennaio, valutato in circa il 15% in termini di Rt tendenziale.

Fortunatamente dopo il 26 aprile la variante inglese non poteva fare danni ulteriori, avendo già raggiunto praticamente il 100% dei contagiati, mentre i vaccinati  sono diventanti sempre più numerosi, procurando il vistoso miglioramento dell’andamento dei contagi osservato dalla fine di aprile ad oggi.

Seminario introduttivo sui dati del sito CovidStat

Il sito covidstat ha raggiunto un notevole complessità: molti grafici richiedono una certa comprensione delle quantità che vi sono rappresentate e spesso un testo scritto non è l’ausilio preferito da molti.

Abbiamo allora pensato di preparare un video nel quale si presentano le motivazioni per la creazione del sito stesso e vi è una prima spiegazione, pittosto generale, dell’approccio matematico utilizzato per estrarre informazioni utili dai dati.

Per visualizzare il video cliccare sull’immagine qui sotto:

Copertina del video seminario

Una fotografia precisa

A inizio pandemia (da marzo 2020 all’estate) le misure restrittive sono state uguali per tutta l’Italia, mentre dall’autunno 2020 ad oggi si è cercato di adeguarle a realtà più piccole come regioni, province e comuni. Come conseguenza, i grafici relativi a tutta l’Italia danno solo un’immagine mediata di tante piccole realtà differenti e per avere una fotografia precisa è necessario studiare la singola regione, o meglio ancora la singola provincia. A questo scopo il sito si è arricchito di molti grafici relativi alle province (tutti quelli ottenibili dai dati della protezione civile) raggiungibili all’interno della sezione grafici, selezionando per i 3 sottocampi “Regioni”, “dati” e “province” rispettivamente il nome della regione, la voce province e il grafico che si vuole vedere (come indicato in figura 1). Continua a leggere

Rt: un mistero svelato

Lo sviluppo di un’epidemia è un processo complesso:  In questo blog vogliamo illustrare il legame che c’è tra il numero di positivi giornalieri e il valore dell’indice Rt.

Semplificando, possiamo dire che lo sviluppo dell’epidemia dipende essenzialmente da due fattori.

  • il numero medio di persone contagiate da un soggetto positivo, quantità descritta dall’indice chiamato Rt ;
  • il numero di giorni nei quali una persona rimane positiva e può contagiare; per il COVID questo numero è molto difficile da determinare, ma si ritiene che una stima media attendibile sia di circa 6.5 giorni.

Continua a leggere

Davvero la mortalità in Italia per Covid-19 è la peggiore del mondo?

 

(Quick answer: no, con le opportune correzioni siamo al 20mo posto fra le 42 nazioni con più casi di Covid-19 al mondo)

La mortalità è definita come decessi per Covid-19 divisi per la popolazione totale.
A prima vista l’Italia è fra le peggiori nazioni al mondo, come risulta dal grafico sottostante dove riportiamo la mortalità in funzione dei casi totali per 100000 abitanti per le 42 nazioni con più casi di Covid-19 al mondo.

Continua a leggere