Blog divulgativo sulla matematica applicata

Come l’intuizione può essere fuorviante: probabilità, test e falsi positivi

In questo periodo di quarantena e di isolamento è facile perdersi in questo piovere di numeri e nelle relative interpretazioni. Ci sono volte in cui il buon senso sembra poter descrivere un certo fenomeno. Alla fine è il buon senso - oltre alla legge - che ci dice di fermarci al rosso quando siamo ad un semaforo e di non uscire di casa in caso di pandemia. Il buon senso, però, senza un’appropriata conoscenza dell’argomento ha basi non sempre solidissime. Va bene per il semaforo, va meno bene quando bisogna cucinare una torta, infinitamente meno bene quando bisogna costruire un aereo o quando si parla di medicina. Del resto tutti sappiamo per esperienza che quando si parla di qualcosa che non si conosce a fondo l’intuizione può giocare brutti scherzi o almeno non farci vedere il rischio che certe scelte comportano. Giusto?

Per contrastare l’epidemia di Covid molti paesi stanno guardando ai test sierologici, vale a dire test che possono identificare se siamo già entrati in contatto con il virus SARS-CoV-2 - mi limiterò a dire solo questo sui test, non sia mai che l’intuizione di qualcosa che non conosco possa farmi dire cose sbagliate.

Ci sono molte aspettative su questo tipo di test. Molti nei giorni scorsi, come giornalisti e politici, hanno lamentato il tempo necessario affinché questo tipo di test sia validato in Italia.

Schermata 2020-04-20 alle 21.42.17

In questo video, per esempio, un giornalista si chiede perché un test che “sbaglia nel 4 percento dei casi” non sia già stato validato. Senza voler entrare merito di questa specifica questione medica, oggi vi spiegherò come l’intuizione può essere fuorviante e come un test che di primo acchito possa sembrare molto affidabile, in realtà sbagli più di quanto indovini. Basterà ricordare due-tre cose di probabilità di base per rimanere sorpresi e concludere che il processo di validazione è una questione così delicata da meritare un’analisi profonda e attenta da parte delle Istituzioni in grado di valutare tutte le variabili in gioco.

Prima di tutto in matematica la probabilità di un evento è un numero compreso fra 0 e 1. Se abbiamo un numero in percentuale ci basterà dividerlo per 100 per sapere la probabilità dell’evento corrispondente. Ad esempio la probabilità di pescare una carta di spade in un mazzo di carte napoletane è di 0,25=10/40 il numero di carte di spade diviso il numero delle carte del mazzo. In percentuale le carte di spade saranno quindi il 25%.

gatto_1

Fin qui tutto chiaro?

Onde evitare suggestioni, consideriamo una malattia (più o meno) fittizia che chiameremo “Gattinite”, la malattia che ad un certo punto della vita porta a postare foto di gattini e animali pucciosi su tutti i social a disposizione. Supponiamo che ci sia un esame del sangue che sia efficace al 97% nel rilevare la malattia su un paziente effettivamente malato e che solo nell’ 1% dei casi propone un falso positivo, cioè dà un risultato positivo anche se il paziente è sano. Supponiamo che di questa malattia si ammali lo 0,4% della popolazione (ad esempio 240.000 su 60.000.000, non proprio pochi!).

Sembra che l’esame del sangue sia decisamente affidabile, che ne dite? Facciamo i conti...

Cerchiamo di capire qual è la

probabilità di essere malato sapendo che il test ha dato esito positivo

Da veri matematici facciamo ordine e chiamiamo

+: l’evento in cui siamo Positivi al test

M: l’evento in cui siamo Malati

S: l’evento in cui siamo Sani

Chiameremo quindi:

P(M | +)

la probabilità di essere malato sapendo che il test ha dato esito positivo. In probabilità la barra verticale “ | ” si legge “dato”, ad esempio P(A | B) è la probabilità che accada un evento A dato, o sapendo, che è avvenuto l’evento B. Poiché il test può commettere un errore la probabilità P(M | +) potrebbe essere minore di 1. Ora calcoliamola!

mani_1

Nel nostro caso la probabilità di essere malato corrisponde allo 0,4% e quindi P(M)=0,004 mentre quella di non esserlo è P(S)= 1-P(M)= 0,996, vale a dire il 99,6%.Inoltre sappiamo che la probabilità di essere positivi al test se siamo malati è P(+ | M)=0,97 mentre la probabilità di essere positivi se siamo sani è P(+ | S)=0,01. Benissimo, ora mettiamo insieme queste informazioni e calcoliamo la nostra probabilità condizionata P(M | +)!

La probabilità P(+ e M) cioè di essere malati e di avere il test positivo sarà
P(+ e M) = P(+|M)xP(M) perché sarò malato con probabilità P(M) e (dato che sono malato) sarò positivo con probabilità P(+|M). Possiamo riscrivere la stessa probabilità in questo modo: P(+ e M) = P(M|+)xP(+), perchè sarò positivo al test con probabilità P(+) e (dato sono positivo) sarò malato con probabilità P(M|+).

Prendiamo l’ultima di queste formule P(+ e M) = P(M|+)xP(+) e, proprio come abbiamo imparato a scuola, dividiamo a destra e sinistra per la probabilità di essere positivi P(+):

P(M| +)=\frac{P( +\, e\, M)}{P( +)}.

Sostituiamo poi la prima formula P(+ e M) =P(+|M) x P(M) nell’espressione appena ottenuta:

 P(M|+)=\frac{P(+\, e\, M)}{P(+)}= \frac{P(+| M)\cdot{P(M)}}{P(+)}  (1)

Siamo sulla buona strada! Non sappiamo qual è la probabilità di essere positivi al test in assoluto ma sappiamo che se siamo malati - cosa che ha probabilità P(M) - allora saremo positivi al test con probabilità P(+ | M)=0,97, mentre se se siamo sani - cosa che ha probabilità P(S) - allora saremo positivi con probabilità P(+ | S)= 0,01. Bene! quindi possiamo scrivere che

P(+)=P(+|M)\cdot P(M)+P(+|S)\cdot P(S)

e sostituendo in P(+) nella formula (1) otteniamo la formula di Bayes

 P(M|+)=\frac{P(+ e M)}{P(+)}= \frac{P(+| M)\cdot{P(M)}}{P(+)}= \frac{P(+| M)\cdot{P(M)}}{P(+|M)\cdot P(M)+P(+|S)\cdot P(S)}  (2)

Ora sappiamo calcolare il denominatore

P(+)=P(+|M)\cdot P(M)+P(+|S)\cdot P(S)= 0,97 \cdot 0,004 +0,01 \cdot 0,996= 0,01384

e il numeratore della formula (2)

P(+| M)\cdot{P(M)}= 0,97 \cdot 0,004= 0,00388

Inseriamo tutti i numeri nella formula (2) e troviamo

P(M|+)=\frac{0,00388}{0,01384} \approx 0,28

Questo vuole dire che solamente nel 28% dei casi una persona uscita positiva al test è effettivamente malata!

Il test sbaglia quasi 3 volte su 4!

Questo ci insegna tre cose, la prima è la formula di Bayes, una formula importantissima, utile per calcolare la probabilità di una causa che ha scatenato un evento verificato.

La seconda, sicuramente più importante, è che a volte l’intuizione può essere fuorviante e farci commettere errori grossolani. Che impatto avrebbe sulla vita delle persone un test che sbaglia ¾ delle volte quando dà un valore positivo? Se quei positivi si considerassero immuni da qualche tipo di malattia quale sarebbe il danno alla collettività?

Terza, nel caso considerato l’alta probabilità di errore del test viene dal fatto che la probabilità di essere malati (P(M)=0,004) è significativamente più piccola della probabilità di avere un falso positivo (P(+|S)=0,01). Per cui, dato un risultato positivo, è più probabile che sia un falso positivo piuttosto che un indicatore di malattia. A parità degli altri parametri, se la probabilità di essere malati fosse stata più alta, ad esempio P(M)=0,05 (il 5%) allora l'84% dei positivi sarebbero effettivamente malati. Per questo è molto importante conoscere la frequenza della malattia nella popolazione ai fini dell’attendibilità di un test. Non consideravate questo dato così importante, vero? beh non abbiamo considerato tante cose come la contagiosità, i fattori ambientali... quali sono davvero i fattori importanti? quali invece non lo sono?

Io non conosco quali siano i fattori da considerare e tirando le somme è giusto che il conto - quello vero per i test per questo disastro chiamato SARS-CoV-2 - lo facciano persone competenti di queste materie, persone che sappiano guardare nella direzione giusta. E noi? Beh noi dobbiamo fidarci degli istituti scientifici. Possiamo farci sicuramente un’opinione delle cose con le informazioni che raccogliamo, consapevoli che potremmo sbagliarci e che saremo pronti a rivedere il nostro punto di vista laddove la scienza ci indichi una via.

Ah ovviamente tutto questo restando a casa. :)

Per eventuali approfondimenti sull’argomento test sierologici:

La domanda 3 qui:

http://www.salute.gov.it/portale/nuovocoronavirus/dettaglioFaqNuovoCoronavirus.jsp?lingua=italiano&id=228#7

qui per i numeri sul covid: https://lab24.ilsole24ore.com/coronavirus/?utm_source=fasciahp#box_14

https://www.ilpost.it/2020/04/21/test-sierologici-coronavirus/

https://www.wired.it/scienza/medicina/2020/04/16/test-sierologici-italia-dubbi/

https://www.repubblica.it/salute/medicina-e-ricerca/2020/04/17/news/test_sierologici_per_il_coronavirus_8_domande_per_saperne_di_piu_-254286864/

 

 

 

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

3 commenti

  1. Rosario's Gravatar Rosario
    aprile 26, 2020    

    Complimenti. Una esposizione chiara e rigorosa unita ad una conclusione illuminante (mi riferisco al fatto di aver evidenziato l'importanza del valore numerico assunto dalla probabilità di essere malati).

  2. diego's Gravatar diego
    aprile 26, 2020    

    Se si ripete il test e la formula con probabilità 0,28 di essere malato, praticamente si ha la certezza della malattia se il risultato ritorna ancora positivo.

  3. maggio 1, 2020    

    Paradosso molto interessante e matematicamente ben spiegato.
    Ci sono peró secondo me alcune imprecisioni:
    la frase "probabilità di essere malato sapendo che il test ha dato esito positivo"
    secondo me andrebbe sostituita con
    "probabilità di avere gli anticorpi contro il SARS-COV-2 sapendo che il relativo test sierologico ha dato esito positivo"

    Avere gli anticorpi non vuol dire essere malato, né essere stato malato, di COVID-19 ma vuol dire essere entrato in contatto col virus SARS-COV-2 (come giustamente specificato all’inizio, ma questa precisione iniziale si perde nel seguito con l’utilizzo della parola “malato”).

    Inoltre, credo che valga la pena di evidenziare che questo paradosso vale solo per I test sierologici su campioni casuali di popolazione, ma non vale nel caso dei tamponi (che invece rilevano la presenza del virus in persone sospette).
    Qui c’è uno studio svizzero sull’accuratezza dei tamponi:
    https://www.revmed.ch/RMS/2020/RMS-N-689/Performance-du-frottis-nasopharynge-PCR-pour-le-diagnostic-du-Covid-19.-Recommandations-pratiques-sur-la-base-des-premieres-donnees-scientifiques
    Se il medico ordina il tampone è perché dai sintomi e dalle altre condizioni (fumatore, malattie pregresse, età, ecc.) la probabilità di essere malato è (secondo questo articolo) in genere tra 10% e 50% e quindi la probabilità di un falso positivo è tra 1% e 14%, non 72% come per i test sierologici fatti su campioni casuali.

Lascia una risposta

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Iscriviti alla nostra newsletter

Resta aggiornato sui nostri post e su quello che facciamo.

Canale Telegram dedicato alla Matematica

Iscriviti sul nostro canale Telegram

MIA15 - Nomination

Rimani aggiornato sui più interessanti articoli di divulgazione matematica e non solo!

Seguici su Twitter

Tag Cloud

Partecipa all’indagine “Io e la Matematica”

Clicca sull'immagine sottostante per rispondere al breve e anonimo questionario:

MIA15 - Nomination

Conviditi con i tuoi contatti questo link!

Grazie per il sostegno ai #MIA2015

Grazie a tutti per averci votato ai "Macchia Nera Awards 2015" nella categoria "Miglior Sito Tecnico-Divulgativo".

Siamo arrivati in finale grazie al vostro sostegno!

MIA15 - Nomination