Blog divulgativo sulla matematica applicata

Fit dei dati: l'unisci i puntini degli scienziati

Da piccolo avevo una passione per il gioco "unisci i puntini" e per le parole crociate crittografate.

Mai avrei potuto immaginare che entrambe queste  cose avessero a che fare con la matematica che avrei applicato "da grande".

In questo post ci concentreremo sull' "unire i puntini" e lasceremo l'altra passione ad un eventuale futuro articolo.image

Mi ricordo chiaramente che da piccolo (complice probabilmente l'assenza di divertimenti più entusiasmanti o il mio essere stato un piccolo nerd) il momento più bello dell'unire i puntini era quando, ad un certo punto, si arrivava ad intuire il disegno che veniva fuori. Da quel momento in poi era una corsa ad unire i puntini per confermare l'intuizione.

Fitting dei dati: il gioco versione per grandi

Una parte significativa del lavoro degli scienziati consiste nel raccogliere  dati sperimentali. Questi valori, che  si traducono in punti su di un piano cartesiano, devono essere collegati fra loro (proprio come il gioco unisci i puntini) attraverso una  relazione matematica che dia luogo ad una unica curva che meglio "spieghi" questi dati (qui sta la differenza, rispetto al gioco: non si cerca una linea spezzata, bensì una singola curva)

Il problema sta tutto nel trovare la "migliore" relazione: vedremo che non è un problema da poco. Scopriremo che, sorprendentemente, alla fine questa relazione si traduce in un grafico che potrebbe non passare per nessuno dei punti sperimentali!

In gergo scientifico si usa indicare questo procedimento con il termine inglese "fit".

La scelta di questa parola mi è sempre piaciuta,  dato che "to fit" significa "stare bene addosso". In qualche modo è come se lo scienziato facesse indossare diversi modelli di vestiti al fenomeno studiato, per capire quello che calza meglio.

Nella mia esperienza, lavorativa e non, mi sono trovato più volte a realizzare dei fit. In particolare, ricordo come un incubo quei fit che si realizzavano a fisica nei vari esami di esperimentazioni di fisica (detta anche  "fisichetta" rispetto ai ben più mastodontici esami di fisica generale).

A me, durante gli esami, quei fit venivano sempre male e ho sempre visto con un misto di disprezzo ed ammirazione i colleghi di corso che, molto spavaldamente, baravano per ottenere dei risultati presentabili.

Nella realtà, il fit dei dati si usa spesso ed in diversi ambiti; per questo motivo tendo ad insistere molto con i miei studenti su questo argomento (spesso saltato a piè pari da molti insegnanti).

Procediamo per passi e vediamo innanzitutto come si crea un grafico a partire da dati reali.

Grafici nella realtà: il punto in realtà è un intervallo

I grafici (rimandiamo al nostro post su questo argomento per chi è poco pratico) che tutti noi siamo stati abituati a vedere, facendo matematica a scuola, sono formati da punti ottenuti a partire da coordinate.

I grafici di chi realizza esperimenti o raccoglie dati  comprendono, invece, al loro interno, gli errori che ogni misura porta con sé inevitabilmente.In altri termini il risultato di una misura dovrà essere espresso da un valore affiancato da un errore come per esempio:

(6.2 \pm 0.1) kg.

Mi ricordo che, avendo scoperto questa cosa solo all'università (avendo fatto il liceo classico le mie scoperte al primo anno di fisica sono stato davvero tante!) rimasi molto sorpreso. È stato per me una sorta di perdita delle certezze, derivanti da una concezione sbagliata di scienze esatte.

Inseriamo qui di seguito un paio di esempi di grafici in cui sono rappresentati gli errori per mezzo di segmenti detti anche barre (che, in base al tipo di problema, possono essere rappresentate su uno solo o su entrambi gli assi).

imageimage

Il fit è un metodo matematico che ha come obiettivo quello di minimizzare la distanza fra i punti sperimentali e la curva individuata.

In pratica si assume un andamento descritto matematicamente da una funzione  (per esempio quello di un retta $latex y=mx+q $ o di un polinomio di grado n) e si cercano i valori dei parametri (nel caso della retta m e q) che rendono minima la distanza fra i punti e la curva che si traccerà

Se sono indicati gli errori delle singole misure (cosa che se parli con un fisico è considerato giustamente  il minimo sindacale per fare una cosa seria!) i punti con una barra di errore molto piccola hanno un peso maggiore rispetto a quelli con un grande errore.

La cosa ha assolutamente senso visto che più precisa  è la misura più siamo convinti che la curva dovrà passare vicino a quel punto.

Nella figura seguente mostriamo un esempio di curva ottenuta facendo il fitting di un esperimento didattico in cui si sono misurati il tempo e le posizioni corrispondenti di un corpo.

Esempio di fit lineare. In questo caso la curva scelta per "fittare" i dati è una retta

Esempio di fit lineare. In questo caso la curva scelta per "fittare" i dati è una retta 

Limiti vari: quanti punti servono e  come scelgo la funzione di fitting?

Il fit dei dati è uno strumento potente ma non è la bacchetta magica. È necessario, infatti, decidere prima quale tipo di relazione matematica provare ad usare per fare il fit.

È qui che serve avere una teoria che ci dovrebbe fornire delle indicazioni su quale andamento aspettarsi.

Se queste indicazioni non ci sono non resta che procedere per prove ed errori. Questo metodo viene anche indicato con l'approccio "data driven" ovvero quello in cui sono i dati a guidare i tentativi che vengono fatti.

Un altro degli aspetti delicati è capire quanti punti usare (ovvero quante misure fare). C'è sempre, infatti, la possibilità che il dato acquisito in un intervallo successivo cambi totalmente le carte in tavola!

Ovviamente si può rispondere dicendo: più misure hai e meglio è. Fare tante misure però non è mai gratis ed in genere ha un alto costo di tempo e risorse.

Certamente però non bastano due punti! Scrivo questo perché in un progetto a cui ho lavorato, un gruppo presentava un software che, tra le molte cose che implementava, faceva anche il fit dei dati. In quel caso, il problema era che durante la demo davanti al cliente facevano esempi utilizzando solo due punti... Certo è un bel rischio parlare di fit e poi fare esempi con due punti, visto che per due punti è noto a tutti che passa una ed una sola retta.

Ma come posso fare un fit?

In uno dei prossimi post vedremo delle proposte di strumenti da usare per imparare a fare dei fit.

Di strumenti ce ne sono tanti... Ci sono perfino delle App per tablet che lo fanno (queste App insieme con excel sono quelle che provo a far usare a scuola ai miei studenti con risultati alterni).

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

Nessun commento ancora

Lascia una risposta

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Iscriviti alla nostra newsletter

Resta aggiornato sui nostri post e su quello che facciamo.

Canale Telegram dedicato alla Matematica

Iscriviti sul nostro canale Telegram

MIA15 - Nomination

Rimani aggiornato sui più interessanti articoli di divulgazione matematica e non solo!

Seguici su Twitter

Tag Cloud

Partecipa all’indagine “Io e la Matematica”

Clicca sull'immagine sottostante per rispondere al breve e anonimo questionario:

MIA15 - Nomination

Conviditi con i tuoi contatti questo link!

Grazie per il sostegno ai #MIA2015

Grazie a tutti per averci votato ai "Macchia Nera Awards 2015" nella categoria "Miglior Sito Tecnico-Divulgativo".

Siamo arrivati in finale grazie al vostro sostegno!

MIA15 - Nomination