Nella vita di tutti i giorni capita molte volte di trovarsi di fronte a situazioni che riteniamo essere, più o meno indiscutibilmente, normali. Questo successe anche allo statistico Pearson, che per primo chiamò ‘Normale’ la distribuzione gaussiana. La storia della distribuzione normale è abbastanza intricata. Tra la fine del 1700 e gli inizi del 1800, Laplace e Gauss la scoprirono per descrivere la distribuzione degli errori e analizzare dati astronomici, per questo porta il nome di Gauss. Più correttamente si dovrebbe dire che la ‘riscoprirono’, perché per la prima volta comparve nel 1733 nella seconda edizione di un libro scritto dal matematico e statistico De Moivre.1 Cosa è e cosa rappresenta la distribuzione normale? Andiamo per ordine.
Supponiamo di lanciare un dado per 5 volte e chiederci quale sia la probabilità che esca il numero ‘2’ in 3 lanci. Per ogni singolo lancio, la probabilità che esca il numero ‘2’ sarà 1/6, mentre quella che non esca è 5/6. Ogni singolo lancio è indipendente dal successivo, quindi la probabilita’ totale è il prodotto delle singole probabilita’.
Una situazione possibile e’ questa:
Primo lancio |
2 |
1/6 |
|
Secondo lancio |
2 |
1/6 |
|
Terzo lancio |
2 |
1/6 |
|
Quarto lancio |
Numero diverso da 2 |
5/6 |
|
Quinto lancio |
Numero diverso da 2 |
5/6 |
La probabilita’ di questa situazione che indicheremo con (2,2,2,x,x) è
$$\left( \frac{1}{6}\right)^3\left( \frac{5}{6}\right)^2$$
e x indica un qualunque numero da 1 a 6, diverso da 2. Chiaramente questa non è l’unica situazione possibile, ce ne saranno altre 9, che corrispondono a :
(2,2,2,x,x) (x,x,2,2,2)
(2,2,x,2,x) (x,2,x,2,2)
(2,2,x,x,2) (2,x,2,x,2)
(2,x,2,x,2) (2,x,2,2,x)
(2,x,x,2,2) (x,2,2,2,x)
Per cui la probabilità che lanciando un dado per 5 volte esca il numero ‘2’ in 3 lanci è
$$10\left( \frac{1}{6}\right)^3\left( \frac{5}{6}\right)^2 =0,032.$$
La definizione generale di questa distribuzione di probabilità , che si chiama distribuzione binomiale $$P(k)$$ è
$$\frac{n!}{k!(n-k)!}p^k (1-p)^{n-k}$$
dove n è il numero totale di prove, k è il numero di successi, p è la probabilità di successo e (1-p) la probabilità di insuccesso. Più nello specifico, il coefficiente binomiale , che è il primo termine, esprime il numero di situazioni possibili mentre i restanti due termini danno la probabilità di ciascuna delle situazioni. Nell’esempio precedente n=5, k=3 e p=1/6.
Questa distribuzione è discreta, cioè la variabile casuale può assumere un numero discreto di valori. Tornando all’esempio, quando si lancia un dado si può ottenere un numero intero da 1 a 6.
Passiamo ora ad un altro esempio, immaginiamo di lanciare una moneta 10 volte e chiediamoci la probabilità di ottenere ‘testa’ per 3 volte. Sappiamo già come si calcola questa probabilità, l’unica differenza col caso precedente e’ che in questo caso
$$p=1-p=1/2$$
per cui semplicemente questa probabilità sarà data da $$120 1/2^3 (1/2)^{8}=0.12$$. All’aumentare del numero dei lanci, la distribuzione di probabilità che si ottiene si chiama distribuzione gaussiana o normale, ed è proprio questo il modo in cui De Moivre la scopre.
Abbiamo visto quindi come si ottiene la distribuzione normale o gaussiana a partire dalla distribuzione binomiale. Qui si chiude la prima puntata, nella seconda parte vedremo quali sono le principali caratteristiche della distribuzione normale e i motivi della sua indiscussa fama!
1 Questo libro è stato scritto in latino e in inglese, perche’ De Moivre è dovuto fuggire dalla Francia verso l’Inghilterra durante la persecuzione degli ugonotti.
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Ancora nessun commento