Francesco Di Lauro (fonte: https://twitter.com/ProbAtSussex/status/1127889452540547072 )

 

Pubblichiamo questo articolo scritto da Francesco Di Lauro, studente all’ultimo anno di dottorato in  matematica applicata a modelli biologici alla University of Sussex.

Nell’articolo, si affronterà il tema del controllo di epidemie nell’ambito  della Network theory, con una breve panoramica della complessità  che si  nasconde sotto la modellizzazione di una epidemia che si diffonde su una  rete di contatti sociali. Infine, si parlerà delle moderne sfide  dell’epidemiologia in questo ambito, con particolare enfasi sul contact  tracing.


Introduzione

Ci avviciniamo al primo anniversario degli annunci di misure restrittive a seguito di epidemia da Sars-Cov-2. Inizialmente si parlava di restrizioni mirate, quarantene a chi testa positivo, ed in generale di misure locali. Ben presto però, il numero di positivi testati è cominciato a salire fino ad essere considerato fuori controllo, inducendo governi di tutto il mondo a prendere misure più  o meno severe per limitare la diffusione del contagio.

Dopo un anno, appare chiaro che l’obiettivo di eradicare completamente la malattia sia irraggiungibile. In molti dunque si domandano come sia possibile che l’unica soluzione sia chiuderci in casa, e non si riesca a trovare una strategia migliore per arginare la diffusione del virus.

Vorrei dunque fare un piccolo excursus sui “problemi” che affrontano gli epidemiologi quando studiano una malattia che si diffonde su scala globale.

Iniziamo con il dire che l’epidemiologia è una disciplina incredibilmente vasta, ed ha bisogno di competenze che spaziano dalla matematica pura alla biologia da laboratorio, con molte sfumature al suo interno.

Il problema alla base è che la biologia che guida l’evento infezione di suo è complessa, dunque caratterizzare bene i profili di infettività, i tempi di recupero e tutti i parametri che informano la probabilità che una persona si infetti a seguito di un contatto con una fonte di contagio (sia essa un’altra persona, un luogo contaminato, un oggetto…), richieda spesso mesi di studi, se non anni. Con il Covid-19 poi, si è dimostrato che una percentuale variabile (a seconda dello studio) di persone positive al virus sia asintomatica.

Inoltre appare chiaro da studi pubblicati che si diventa infettivi prima di mostrare sintomi (in media un giorno prima). Dunque non è sempre chiaro capire se la persona di fronte sia chiaramente infettiva o meno. A ciò, aggiungiamo due fonti che complicano di molto gli scenari possibili, ovvero l’esistenza di nuove varianti, probabilmente più contagiose e letali, ed il rollout dei vaccini, la cui efficacia `e dimostrata solo nel ridurre la severità, non sul ridurre la trasmissibilità.

Supponiamo però di avere un modello del decorso di una malattia abbastanza verosimile, che ci permetta di poter iniziare a capire come questa malattia si diffonda in una popolazione.

I fondamenti

Il fondamentale modello, di cui oramai tutti gli interessati all’argomento hanno sentito parlare, è il cosidetto SIR. In tale modello, la popolazione è divisa in compartimenti, ovvero ogni individuo è suscettibile (S), oppure infetto (I), altrimenti rimosso (R).

Il modello dunque si caratterizza da equazioni della forma:

$\dot{S} \ =\  – \beta I S$ 

$\dot{I}\ =\  \beta I S – \gamma I $ 

$\dot{R}\ =\   \gamma I$

dove $\beta$ e $\gamma$ hanno in sé tutta la biologia del fenomeno, e sono legati a quanto è probabile infettarsi a seguito di un contatto e quanto tempo in media serve per smettere di essere infettivi, rispettivamente. Solitamente le condizioni iniziali sono della forma $I(0) = 1, S(0) = N-1, R(0) = 0$, dove $N$ è il numero di persone nel sistema che si studia.

Questi modelli sono detti ad homogeneous mixing, perchè se uno va ad interpretare le quantità a destra degli uguale, scopre che IS dovrebbe modellare il numero di contatti tra persone, ma questo significa che tutti sono in contatto con tutti. In una popolazione di 1000 persone ad inizio epidemia, un infetto avrebbe 999 contatti totali con persone sane, dieci infetti circa 10 · 990 = 9900 e così via.

Chiaramente ciò non è verosimile, dunque per fittare i dati che si osservano, dobbiamo caricare β di un significato che trascende quello biologico da cui eravamo partiti, rendendo il modello facilmente attaccabile. Dunque bisogna separare la parte “biologica” da quella “sociale”.

Reti sociali

Il problema più importante è caratterizzare la rete dei contatti tra le persone. In questo caso, ci viene in aiuto la teoria delle reti, disciplina nata più di tre secoli fa con il celebre lavoro di Eulero sui ponti di Koningsberg, poi sviluppata, tra gli altri, da personalità famosissime nella storia recente, quali Paul Erdős, Steven Strogatz, Albert-László Barabási.

L’idea è di immaginare le persone all’interno di una popolazione come nodi in un grafo, e di modellare i contatti tra persone come link che connettono nodi. Una persona malata dunque, può contagiare le persone con cui viene in contatto, e questo incide profondamente sul corso delle epidemie. Un esempio di ciò si può vedere in figura 1.

Figura 1: Esempio di rete sociale e snapshot di epidemia simulata sul famoso Zachary-Karate club graph.

 

Per quanto un po’ difficile da notare senza entrare troppo nei dettagli, appaiono evidenti due fatti.

Il primo, è che se guardiamo intorno ad un nodo colorato di rosso osserviamo una tendenza ad avere vicini rossi anche essi. Questo tecnicamente significa che esiste una correlazione tra persone in contatto in termini epidemiologici, ovvero se una persona è infetta, i suoi contatti probabilmente sono infetti. Questo è il motivo per cui il Tracing è così importante, ad esempio.

L’altro fatto è che se si agisce su alcuni nodi, e si eliminano oculatamente alcuni link, possiamo dividere il grafo in due parti fondamentalmente sconnesse, di fatto partizionandolo in sottografi che possono essere visti come compartimenti stagni in cui l’epidemia, se non è già presente, non può entrare. Tutte queste proprietà si possono formalizzare sia con equazioni differenziali ordinarie, che di fatto modificano il modello SIR, sia con equazioni differenziali stocastiche più precise.

Come descrivere epidemie su network

Generalmente quando si approccia lo studio di epidemie su network, si guarda al fenomeno tramite equazioni differenziali stocastiche. L’approccio probabilmente più diffuso è quello dei processi Markoviani continui, in cui ogni nodo suscettibile diventa infetto ad un rate proporzionale ad una costante τ per il numero di nodi infetti con cui ha link. Una volta infetto, un nodo diventa infettivo fino a quando non smette, e ciò avviene ad un tempo distribuito esponenzialmente con un rate costante γ.

L’ipotesi di Markovianità risolve moltissimi problemi da un punto di vista analitico, e dei risultati che si conoscono, ma sfortunatamente ha, nascoste, delle assunzioni forti sulla biologia del fenomeno. Dopotutto, se il rate a cui gli infetti guariscono `e costante, significa che la probabilità di guarire dopo un tempo T da quando si diventa infetti è:

$$P(t>T) = e^{-\gamma T}$$

e similmente per la distribuzione di infettività.  In verità si sa che questo non è (fortunatamente) vero, in quanto i profili tipici di tali distribuzioni hanno code molto più trascurabili, e generalmente non si è più infettivi già dopo due o tre settimane dall’inizio dei sintomi.

Per questo, piuttosto recentemente, si sta cercando di abbandonare questa visione in favore di processi non-markoviani, in cui cioè la probabilità di infettarsi o di guarire dipende da quanto tempo si è stati in contatto con un infetto o si è infetti.

Purtroppo tali modelli sono anche molto più  difficili da approcciare analiticamente. In ogni caso, appare chiaro come, se ogni nodo ha tre stati possibili, il numero di equazioni per descrivere il sistema è 3N, chiaramente ingestibile per N abbastanza grande. Questo ci mostra come si è costretti a guardare a statistiche aggregate, come ad esempio il numero di infetti al variare del tempo, e studiare quelle.

Reti di contatto reali

L’esempio in figura 1 è un celeberrimo toy-model, chiamato Zachary Karate- club, vi invito a leggere la sua storia perché interessante. Ciò detto, la realtà è sicuramente più complicata di così.

Innanzitutto la rete dei contatti sociali è estremamente più complicata e densa di questa. Per fare un esempio, riportiamo un frammento minuscolo di una rete sociale virtuale (Facebook), in figura 2.

Figura 2: Closeup di una porzione di rete sociale, presa da http://networkrepository.com/socfb-Amherst41.php

 

 

L’utilizzo di reti virtuali come proxy di reti reali è tipico nella letteratura epidemiologica.

Si notano molti fenomeni interessanti. Per esempio, si nota che andando verso destra, il numero di contatti per nodo tende ad aumentare. La legge con cui ciò avviene è a potenza, ed in effetti si può mostrare che questo fenomeno, detto invarianza di scala, è tipico di tante rete sociali.

Esistono infiniti studi su come epidemie su tali reti si propagano, proprio perché queste reti sono davvero quasi universali. Il fenomeno più interessante di queste reti è la ”robustezza fragile”. Ciò significa che, se tagliamo dei contatti a caso, molto probabilmente la rete rimarrà connessa, ed in termini epidemiologici non riusciamo a fermare i contatti. Viceversa, con interventi mirati, la connettività della rete viene ridotta talmente tanto da avere un impatto enorme sull’epidemia.

Meritano una menzione anche altri aspetti fondamentali, di cui siamo a conoscenza, ovvero l’esistenza di comunità. Pensiamo a gruppi di amici che sono sempre in contatto tra loro, ed hanno molti meno contatti con altri gruppi. Allo stesso tempo, ci sono dei motivi fondamentali, ad esempio il triangolo, ovvero tre nodi che sono in contatto tra loro, come le famiglie. Anche la presenza di triangoli è degna di nota ed è fondamentale nella modellizzazione delle epidemie.

Policy attuabili

Alla luce di tutto questo, ci si domanda come mai non si provi ad adattare tutte le conoscenze sviluppate in decenni di epidemiologia su reti all’approccio pandemico. Purtroppo ci sono più motivi.

Il primo, non per importanza, è la dinamiciTà delle reti. In una giornata normale, si tende sì ad avere un gruppo di contatti abbastanza fisso, ad esempio famiglia, amici, colleghi di lavoro, compagni di scuola… ma anche contatti che si hanno per strada, al supermercato, al bar, in vari negozi. Modellare dunque un processo epidemiologico su una rete che è essa stessa dinamica diventa estremamente più complicato, specialmente se consideriamo l’interplay che esiste tra i due fenomeni (se so che tutti i miei conoscenti si stanno ammalando, prendo più precauzioni).

Ma, il motivo forse più stringente, è che, generalmente, della rete sopra conosciamo qualcosa che si avvicina più a figura 3.

Figura 3: Closeup precedente in cui il 99% dei link sono nascosti. Visualizzazione pittoresca di cosa possiamo aspettarci realisticamente. Alcuni nodi sono colorati di bianco, ad indicare l’appartenza a community diverse

 

Questo significa che siamo fondamentalmente ignoranti riguardo la topologia delle reti sociali.

Grazie ai Big Data, conosciamo quali caratteristiche e proprietà hanno, ma non sappiamo quali nodi hanno quali contatti nel particolare, o quali siano i nodi su cui intervenire.

Questo purtroppo riduce estremamente le possibilità reali di azioni. Ad esempio, una strategia che sembra sensata sarebbe quella di isolare i più a rischio. Suona bene, ma cosa significa in termini di interventi su una rete di cui non si conosce bene la topologia? Questo ci porta alla più dolorosa delle azioni possibili: tagliare contatti tout-court, sapendo che lo sforzo sarà estremamente inefficiente.

Possibile via di uscita

Tenendo conto quindi la complessità del problema e la limitatezza delle risorse reali, l’unico momento in cui è realisticamente possibile agire è quando la prevalenza è molto bassa.

Durante questa finestra, infatti, il sistema di test-tracing si può vedere come una esplorazione locale della rete centrata attorno ai nodi che sono certamente positivi.

In termini di ciò che succede realmente, questo si traduce nel fatto che, quando si hanno pochi casi diagnosticati positivi, uno Stato può avere la capacità logistica e le risorse per tracciare gli eventuali contatti e isolarli in modo da far spegnere tempestivamente ogni cluster epidemico.

Fino a che la prevalenza rimane bassa, questo tipo di interventi possono servire a rallentare molto la crescita dell’epidemia.

Il problema dunque diventa di allocazione di risorse: i mezzi di uno Stato sono finiti e se crescono, possono al più crescere linearmente; un’epidemia, come abbiamo, purtroppo, potuto constatare, se non controllata abbastanza, accelera la sua crescita non linearmente, e addirittura in una prima fase esponenzialmente, diventando ingestibile semplicemente tracciando ed isolando.

A questo punto, tornando al discorso del paragrafo precedente, un drastico taglio dei contatti, un lockdown totale appunto, serve per riportare il più velocemente possibile il numero di nuovi contagi ad un livello in cui un’azione di controllo meno invasiva sia possibile e permetta di tornare ad avere una socialità.

Bibliografia

  • Zachary’s karate club: https://en.wikipedia.org/wiki/Zachary
  • Teorie e simulazioni di epidemie su reti: https://arxiv.org/abs/1408.2701
  • Software per fare simulazioni su reti in Python: https://epidemicsonnetworks.readthedocs.io/en/latest/
  • Sito interessante dove trovare reti di ogni tipo: http://networkrepository.com/

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.