Blog divulgativo sulla matematica applicata

Come salvare le tartarughe con la matematica: l'analisi di regressione applicata alla conservazione degli habitat

sampling_environmental_DNA

Continuiamo con questo post la serie di articoli scritti da esperti in diversi settori che si sono resi disponibili a mostrare come la matematica  è applicata nel loro ambito di ricerca.

In particolare in questo articolo inseriamo l'interessante contributo di Gentile Francesco Ficetola  ricercatore del CNRS  presso Laboratoire d’Ecologie Alpine, Università di Grenoble (Francia).

In questo articolo si mostrerà come la matematica è utilizzata per la conservazione di un habitat utilizzando come esempio  il caso della testuggine palustre.


Analisi di regressione e conservazione degli habitat

Quando si vuole proteggere una specie minacciata, la prima cosa da fare è proteggere gli ambienti con le caratteristiche necessarie alla loro vita, ovvero proteggere il suo HABITAT.

Nella pratica, il problema spesso è capire cosa devo proteggere. Prendiamo l’esempio della testuggine palustre. Questa tartaruga, un tempo abbondante in Italia, ha subito un drammatico declino negli ultimi decenni. Per questo motivo, in molte aree si sta cercando di migliorare le caratteristiche degli ambienti, per permettere a questa testuggine di tornare a popolare stagni e paludi. Ma quali sono gli ambienti di cui le testuggini hanno bisogno?

tartaruga

Tradizionalmente, naturalisti e biologi hanno sempre usato la propria esperienza per identificare gli habitat della specie che vogliono conservare, e pianificare le strategie di gestione. L’esperienza però spesso è troppo soggettiva e non permette di ottenere indicazioni quantitative. Negli ultimi anni, usiamo sempre più modelli statistici per identificare in modo oggettivo come le condizioni ambientali determinano la distribuzione e l’abbondanza delle specie.

Uno dei modelli più semplici è la regressione lineare.

Immaginiamo di studiare i zone umide. Per ogni zona umida, posso misurare l’abbondanza di testuggini (per esempio la densità, individui per ettaro) e alcune variabili ambientali, quali la quantità di vegetazione naturale intorno alla zona umida, le caratteristiche chimico-fisiche, delle acque, la presenza di prede nell’acqua o di punti riparati in cui prendere il sole...

Come identifico le variabili che possono influenzare l’abbondanza delle testuggini?

Il modello di regressione lineare semplice è:

Yi = β0 + β1 Xi + ε

In cui Yi è la variabile dipendente (per esempio, l’abbondanza di testuggini), Xi è la variabile indipendente (per esempio, la concentrazione di fosfati dell’acqua1), β0 è una costante, β1 il coefficiente angolare della funzione di regressione, e ε è l’errore statistico.

Se β1 è significativamente maggiore (o minore) di zero, allora l’abbondanza delle testuggini aumenta (o diminuisce) al variare di X.

Per esempio, in un campione di circa 40 zone umide nel Parco del Delta del Po, si può osservare come l’abbondanza di testuggini cresca nei siti circondati da vegetazione naturale, mentre la relazione tra abbondanza e concentrazione di fosfati nell’acqua è negativa, ma sembra essere più debole

testugini_analisi

testugini_analisi

Per ogni retta riporto l’equazione della retta di regressione2, che in pratica mostra come l’abbondanza di testuggini vari al variare delle due variabili indipendenti.

La relazione tra vegetazione e testuggini è piuttosto netta: β1 è chiaramente maggiore di zero. Per la relazione tra testuggini e fosfati ho ottenuto un valore di β1 inferiore a zero, ma la diminuzione delle testuggini con i fosfati sembra meno chiara.

Posso chiedermi quindi se le relazioni che osservato siano reali, o se siano invece dovute al caso o all’errore statistico. Esistono vari modi per testare se β1 è effettivamente minore (o maggiore) di zero. Uno degli approcci più classici è valutarne la "significatività statistica".

La relazione che osservo è significativa?

Il test di significatività è necessario perché, anche se due variabili sono completamente indipendenti, è quasi impossibile che il valore di β della loro relazione sia esattamente zero. La domanda a cui il test di significatività cerca di rispondere è la seguente: è possibile che le relazioni che osservo siano apparse semplicemente per caso?

La definizione di significatività statistica non è molto intuitiva. Il valore P di una relazione è definito come la probabilità di ottenere un dato valore di β (o valori ancora più estremi), se nella realtà non esiste alcuna relazione tra le due variabili. P varia tra zero e 1: valori prossimi allo zero indicano che è improbabile ottenere una relazione così forte per motivi puramente casuali. Per convenzione, si assume che relazioni con P > 5% siano non significative, perchè esiste una probabilità non irrilevante che siano in realtà dovute al caso.

Nel caso della relazione tra testuggini e vegetazione naturale, ottengo P = 1.31e-07. Questo valore è significativo: esiste solo una possibilità su 10 milioni che tale relazione sia dovuta al caso. Questo è un forte indizio (ma non una prova definitiva) dell’esistenza di una relazione.

Invece per la relazione tra testuggini e fosfati ottengo P = 0.41. Questo vuol dire che ho il 41%v di probabilità di ottenere una relazione di questo tipo, anche se non c’è alcuna relazione tra testuggini e fosfati (ricordiamo che la relazione è molto debole: β = 0.004).

In pratica questo test mi suggerisce che la relazione tra vegetazione e testuggini è probabilmente importante, mentre quella con i fosfati non sembra esserlo.

Quindi, se voglio migliorare l’habitat per le testuggini, una prima azione potrebbe essere cercare di migliorare o aumentare la vegetazione naturale circostante le zone umide, mentre cercare di ridurre il valore di fosfati non sembra essere prioritario in quest’area.

Ma la realtà è molto più complessa!

Quanto visto finora ovviamente semplifica di molto la realtà. Per esempio, nelle nostre analisi abbiamo considerato una variabile per volta, ma nella realtà le caratteristiche ambientali necessarie per questi animali sono molte. Le analisi dovrebbero considerare più variabili contemporaneamente: esistono numerosi approcci statistici per identificare in modo più o meno oggettivo le variabili più importanti.

Per di più, qui abbiamo immaginato delle relazioni lineari, descritte da una retta, ma è anche possibile che le relazioni siano più complesse...

modello_non_lineare

Inoltre, in questo caso abbiamo immaginato una relazione tra abbondanza e habitat. Molto spesso però invece che i valori di abbondanza ho solo i dati di presenza assenza degli animali nei siti. Anche in questo caso, bisogna utilizzare approcci specifici per dati di presenza assenza (quale la regressione logistica).

Ma la cosa più importante è ricordarsi che una relazione significativa non indica sempre un rapporto di causa-effetto. È possibile per esempio che le relazioni osservate siano solo indirette. Per esempio, la vegetazione intorno allo stagno potrebbe influenzare la disponibilità di siti per deporre le uova, che a loro volta influenzano l’abbondanza di testuggini...

La statistica sta diventando sempre più importante in biologia: aiuta a identificare relazioni e a prendere decisioni di fronte a una realtà estremamente complessa, in cui la semplice opinione dell’esperto non basta. La biostatistica sta facendo "passi da gigante" e nei nostri studi spesso creiamo modelli molto complessi, ben più di quanto mostrato qui sopra. Non bisogna però perdere di vista la realtà: la cosa più difficile è creare un modello che funzioni dal punto di vista statistico, ma che resti ancorato a quanto avviene in natura.

Gentile Francesco Ficetola

CNRS & Univ. Grenoble-Alpes, Francia

Note:

1 La concentrazione di fosfati è una misura classica della qualità delle acque. Concentrazioni alte normalmente indicano acque ricche in nutrienti ("eutrofiche"). Alte concentrazioni possono indicare acque inquinate, ma in alcune condizioni possono anche essere generate da processi naturali.

2 Prima di calcolare le rette di regressione, è stato calcolato il log10 dell’abbondanza delle testuggini.

Qualche lettura:

I dati utilizzati vengono da questo articolo:

- Ficetola, G.F., Padoa-Schioppa, E., Monti, A., Massa, R., De Bernardi, F., Bottoni, L., 2004. The importance of aquatic and terrestrial habitat for the European pond turtle (Emys orbicularis): implications for conservation planning and management. Canadian Journal of Zoology 82, 1704-1712.

Un’introduzione molto semplice e in italiano all’uso della statistica per studiare gli animali:

- Fowler, J., Cohen, L., 1993. Statistica per ornitologi e naturalisiti. F. Muzzio editore, Padova.

Qualche libro per approfondire (in inglese...)

- Sokal, R.R., Rohlf, F.J., 2012. Biometry. W. H. Freeman and Company, New York.

- Field, A., Miles, J., Field, Z., 2012. Discovering Statistics Using R. SAGE Publications.

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Similar posts

Nessun commento ancora

Lascia una risposta

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Canale Telegram dedicato alla Matematica

Iscriviti sul nostro canale Telegram

MIA15 - Nomination

Rimani aggiornato sui più interessanti articoli di divulgazione matematica e non solo!

Iscriviti alla nostra newsletter

Resta aggiornato sui nostri post e su quello che facciamo.

Seguici su Twitter

Tag Cloud

Grazie per il sostegno ai #MIA2015

Grazie a tutti per averci votato ai "Macchia Nera Awards 2015" nella categoria "Miglior Sito Tecnico-Divulgativo".

Siamo arrivati in finale grazie al vostro sostegno!

MIA15 - Nomination