fbpx Tracciamento: i dati vanno presi con le pinze | Scienza in rete

Perché i dati di tracciamento vanno presi con le pinze

Primary tabs

tracciamento

Dopo molti mesi di pandemia abbiamo capito che il tracciamento dei contatti è una misura indispensabile per cercare di contenere la diffusione del virus. Tuttavia, i dati non «parlano», ma devono essere attentamente interpretati. Per esempio, tracciare i contatti familiari o lavorativi è molto più semplice che tracciare quelli avvenuti in autobus. Come operare nel migliore dei modi?

Immagine: Pixabay License.

Tempo di lettura: 6 mins

Purtroppo, l’ora della clausura è ritornata. I nuovi casi di Covid-19 in Italia stanno crescendo in modo esponenziale da alcune settimane, e a essi inevitabilmente si associa una pressione crescente sui servizi sanitari e, tragicamente, un aumento considerevole dei decessi.
Ora però, come viene ripetuto incessantemente, la situazione è completamente diversa dai drammatici momenti del marzo scorso. In particolare, l’esperienza maturata nella prima ondata ci può aiutare a pianificare in modo più efficace la risposta a questa seconda ondata. Indubbiamente, il grande sforzo di ricerca medica a seguito della prima ondata ha permesso la definizione di strumenti clinici più efficaci. Va anche preso atto di una maggiore sensibilità tra la popolazione, che in larghissima maggioranza sta ottemperando ammirevolmente a misure di prevenzione come indossare la mascherina. Ciò nonostante, il problema principale che si trovano a fronteggiare politici ed epidemiologi al momento è la stima dell’efficacia di misure di chiusura mirate. Ovviamente qualsiasi chiusura si accompagna con un danno economico consistente e ben quantificabile sia per la categoria colpita (ad esempio gestori di ristoranti), sia per la fiscalità generale che provvede un indennizzo parziale. Per cui la domanda fondamentale è: qual è l’effetto sulla propagazione dell’epidemia di una chiusura parziale? In altre parole, serve più chiudere le palestre o i bar? Sono due gli approcci possibili per rispondere a queste non semplici domande.

Il primo approccio, seguito recentemente da un gruppo di ricercatori dell’Università di Edimburgo1, consiste nel valutare l’effetto sulla pandemia di misure individuali prese in alcuni paesi durante la prima ondata. Naturalmente, tutti i paesi che hanno avuto a che fare con la prima ondata hanno dovuto prendere molteplici misure in un lasso di tempo brevissimo, per cui dipanare da questa matassa il contributo di misure individuali come la chiusura delle palestre è molto difficile, infatti gli effetti quantificati si riferiscono a misure a largo spettro come riduzione dei contatti sociali o chiusura delle scuole.

La seconda opzione, invece, utilizza dati di tracciamento. Sia durante la prima ondata e ancor più adesso, una frazione consistente dei casi viene scoperta tramite tracciamento dei contatti. Questa attività è essenziale per rompere le catene di contagio, isolando individui infettivi prima che insorgano sintomi. Ma può anche dare informazioni sulla pericolosità relativa di diversi ambienti, poiché il tipo di contatto in genere è noto nei casi di tracciamento manuale, che costituiscono tuttora la stragrande maggioranza dei tracciamenti2. Ovviamente, queste informazioni, qualora pubbliche, possono anche essere usate da privati: a esempio, è notizia recente che l’associazione dei ristoratori di Berlino è riuscita ad ottenere un’ingiunzione giudiziaria che sospende il coprifuoco annunciato dal governo statale, proprio basandosi su dati di tracciamento pubblicati dal Robert Koch Institute (RKI, l’equivalente tedesco dell’Istituto Superiore di Sanità).

Ma quindi cosa sta succedendo? Forse la famigerata movida non è il pericolo che tutti credevamo? Per capire meglio la situazione, osserviamo due grafici: in Figura 1 vediamo il grafico originale riportato nel rapporto dell’RKI.

tracciamento, RKI

Figura 1 Numero di contatti positivi Covid-19 in base al tipo di contatto durante la prima ondata in Germania. In blu, contatti domestici, in verde, contatti in ambito lavorativo, in giallo contatti in ambito ospedaliero.

Durante tutta la prima ondata, i contatti familiari, lavorativi e ospedalieri la fanno da padrone, mentre i contatti in ristoranti e bar non sono praticamente visibili. Sulla base di questo, i giudici berlinesi hanno deciso che l’evidenza dei dati non giustificava la misura di coprifuoco per i locali. A prima vista, sembrerebbe una vittoria per l’evidenza. Ma la situazione è molto diversa. A parte il fatto ovvio che forse i contagi nei bar non avvenivano perché gli stessi bar erano chiusi, il vero grafico che avrebbe dovuto riportare il RKI è il seguente (Figura 2): di gran lunga la maggior parte dei casi (73%) durante la prima ondata in Germania non erano tracciabili (barre rosse in Fig. 2)3.

tracciamento, unknown

Figura 2 Stesso grafico che in Figura 1, ma adesso raffigurante tutti i positivi, non solo quelli tracciati. In rosso i casi con origine ignota.

Ma dov’è il problema? Non possiamo semplicemente assumere che le proporzioni rimangano le stesse anche tra i casi non tracciati. No. Si tratta di un errore sottile, ma gravissimo. Per capire il perché, dobbiamo anzitutto ragionare sul processo di tracciamento e sul suo funzionamento.
Quando viene scoperto un nuovo positivo, i conviventi vengono tutti sottoposti a test diagnostico. Ugualmente, con le misure adottate durante l’estate in Italia, colleghi stretti e compagni di classe di un positivo sono sottoposti a tampone. Da questo si deduce che non è possibile che un caso che non è stato tracciato sia di origine domestica, visto che tutti i conviventi di un positivo vengono testati (a meno che non ci si trovi di fronte ad un falso negativo al tampone). Invece, un individuo che venga contagiato da un estraneo sull’autobus o al bar non ha la minima possibilità di individuare il contatto che l’ha contagiato, e andrà inevitabilmente ad ingrossare la falange di casi non tracciabili (la colonna rossa in Figura 2)4.

Questo ragionamento semplice ci rivela un fatto fondamentale: il tracciamento è una misurazione sperimentale e, come tutte le misurazioni, ha un livello di rumore associato. In questo caso, il rumore (la probabilità di non riuscire a trovare l’origine del contagio) dipende fortemente dall’origine del contagio. Di conseguenza, proporzionalmente, la frazione di casi di origine ignota attribuibile a situazioni dove il tracciamento è difficile sarà molto più alta di quanto appare da grafici come quello in Figura 1. Per utilizzare dati di tracciamento in maniera sensata, è dunque essenziale che questo rumore sperimentale venga modellizzato accuratamente5.

La decisione dei giudici berlinesi era perciò basata sì sui dati, ma sfortunatamente su una lettura sbagliata dei dati. L’errore è sottile, ma pervasivo: lo vediamo anche in Italia nella discussione sulla pericolosità delle scuole che sistematicamente ignora il fatto che il tracciamento cui sono sottoposti i contagi scolastici è estremamente stringente. D’altro canto, la mancanza di metodi effettivi di tracciamento in situazioni come la movida, le spiagge o il trasporto pubblico potrebbe portarci erroneamente a sottovalutarne la pericolosità.

Concludendo, l’importanza dei dati di tracciamento è sicuramente centrale nel capire come si diffonde questo terribile virus che ci tiene in scacco da quasi un anno. Ma va sempre ricordato che qualsiasi misurazione di un processo – fisico o epidemico che sia – è imperfetta, e un uso acritico dei dati può facilmente trarre in inganno. Nel caso dei dati di tracciamento, questo può avere un impatto enorme sulle decisioni politiche e su quanto queste vengono accettate dalla popolazione. È fondamentale, perciò, che la scienza dei dati sia compresa e spiegata in modo almeno altrettanto chiaro che la scienza del virus.

 

Note
[1] Han E. et al. Lessons learnt from easing COVID-19 restrictions: an analysis of countries and regions in Asia Pacific and Europe, The Lancet (2020): https://doi.org/10.1016/S0140-6736(20)32007-9.
[2] Nel caso di tracciamento tecnologico, a esempio attraverso la app Immuni, questa informazione non è disponibile per ragioni di privacy.
[3] Sono grato a Ullrich Koethe dell’Università di Heidelberg per avermi informato sull’episodio giudiziario berlinese e per avermi fornito questo grafico.
[4] Questo tipo di tracciamento non è possibile neppure con le app, poiché non viene registrata la geolocalizzazione dei contatti.
[5] Queste idee possono essere rese in modo preciso e rigoroso usando concetti elementari della probabilità Bayesiana.

Scienza in rete è un giornale senza pubblicità e aperto a tutti per garantire l’indipendenza dell’informazione e il diritto universale alla cittadinanza scientifica. Contribuisci a dar voce alla ricerca sostenendo Scienza in rete. In questo modo, potrai entrare a far parte della nostra comunità e condividere il nostro percorso. Clicca sul pulsante e scegli liberamente quanto donare! Anche una piccola somma è importante. Se vuoi fare una donazione ricorrente, ci consenti di programmare meglio il nostro lavoro e resti comunque libero di interromperla quando credi.


prossimo articolo

Generazione ansiosa perché troppo online?

bambini e bambine con smartphone in mano

La Generazione ansiosa. Come i social hanno rovinato i nostri figli (Rizzoli, 2024), di Jonathan Haidt, è un saggio dal titolo esplicativo. Dedicato alla Gen Z, la prima ad aver sperimentato pubertà e adolescenza completamente sullo smartphone, indaga su una solida base scientifica i danni che questi strumenti possono portare a ragazzi e ragazze. Ma sul tema altre voci si sono espresse con pareri discordi.

TikTok e Instagram sono sempre più popolati da persone giovanissime, questo è ormai un dato di fatto. Sebbene la legge Children’s Online Privacy Protection Act (COPPA) del 1998 stabilisca i tredici anni come età minima per accettare le condizioni delle aziende, fornire i propri dati e creare un account personale, risulta comunque molto semplice eludere questi controlli, poiché non è prevista alcuna verifica effettiva.