Statistica e Smartphone

Un anno  fa mi si è fuso il cellulare 🙁

Nello scegliere il degno sostituto, una delle prime informazioni che sono andata a verificare è stato il tempo medio di durata della batteria, almeno da dispositivo nuovo. Provate a negare che uno dei “problemi” che ha cominciato da qualche anno ad affliggerci tutti è la durata della batteria del nostro smartphone, o tablet o portatile 😉

Immagino che il link statistica – batteria smartphone possa sembrare alquanto privo di senso.

In realtà è un ottimo pretesto per provare a introdurvi alla cosiddetta STATISTICA INFERENZIALE e, più in dettaglio, condurvi nel magico mondo della TEORIA DEI TEST D’IPOTESI.

Quando inciampiamo in informazioni sintetiche di tipo quantitativo, solitamente espresse sotto forma di media (durata media dell’effetto di un farmaco, tempo medio di elaborazione, …) come possiamo capire se quell’informazione è globalmente valida? Affidabile? E più importante, se riscontro un risultato diverso da quello atteso, come stabilire se tale differenza è casuale o significativa? Cioè, se io comprassi un telefono con dichiarate 6 ore di autonomia ma invece ne fa 5, sono stata sfigata, il telefono è rotto oppure l’azienda ha dichiarato il falso?

Se questo articolo si trova su questo blog, e se voi lo state leggendo, ormai avrete capito che la risposta base alle nostre domande più o meno è sempre quella: MATEMATICA. In particolare vedremo come la STATISTICA può fornire informazioni e risposte estremamente interessanti.

La Statistica Inferenziale e La Teoria dei Test

Lo so, lo so. Quando sentite la parola “statistica” principalmente la vostra mente visualizza:

  • grafici vari (istogrammi, torte, serie storiche)

20141113_chart_js

  • percentuali in sovrimpressione nei vari telegiornali

Ma tranquilli. Succede a tutti 😉

Non serve che vi dica (anche se lo sto facendo 😛 ) quanto questo sia solo un aspetto marginale e superficiale della teoria statistica attualmente conosciuta.

Infatti la scienza statistica è comunemente suddivisa in due branche principali:

  • statistica descrittiva, a cui siamo più visibilmente esposti e la quale ha come scopo quello di sintetizzare i dati grazie ai suoi strumenti grafici e indici;
  • statistica inferenzialepiù nascosta anche se inconsapevolmente ne facciamo ricorso tutti i giorni, e il cui obiettivo è di poter fare inferenza, quindi dedurre, la natura teorica (anche detta legge probabilistica) di un certo fenomeno osservato, così da poter effettuare, con un margine di errore predefinito, previsioni su di esso. Già da qui si può intuire il forte legame con la teoria della probabilità.

La statistica inferenziale si suddivide a sua volte in: la teoria della stima (stima puntuale e stima intervallare) e la verifica delle ipotesi (detta anche teoria dei test).

schema

La teoria dei test si pone come obiettivo quello di capire se un risultato, osservato su un campione, è CASUALE o SIGNIFICATIVO. Cioè se le conclusioni deducibili dall’osservazione di tale risultato possono essere estese o meno all’intera popolazione da cui il campione è stato estratto.

Ipotesi NULLA vs Ipotesi ALTERNATIVA: quanto dura sta batteria???

Ipotizziamo quindi di comprare il nostro nuovo e bellissimo smartphone della marca X e modello Z, in cui viene dichiarato che la batteria ha una durata media pari a 368 minuti circa (6 ore).

Ma questo è un modello all’ultima moda, e anche i nostri amici lo hanno comprato uguale. Abbiamo a disposizione 25 smartphone tutti stessa marca X e modello Z.

E’ possibile sottoporre le 25 batterie a prova, e confrontare il tempo medio di durata delle batterie del campione (la statistica campionaria) con la media di 368 minuti dichiarata (il valore ipotizzato del parametro) – lo so, lo so, a nessuno di voi verrebbe in mente ma assecondatemi 😉 .

Il test delle ipotesi consente di verificare se, e quanto, una determinata ipotesi (in questo caso a quanto ammonta la durata media della batteria ma le ipotesi possono essere di qualsiasi tipo e riguardare qualsiasi contesto: biologico,  medico, economico,…) sia supportata o meno dall’evidenza empirica, cioè dall’informazione racchiusa nei dati a disposizione.

Utilizzando un linguaggio formale, il test d’ipotesi è un’area dell’inferenza statistica in  cui si valuta una congettura (l’ipotesi) riguardante una caratteristica (il parametro) della popolazione in esame, sulla base delle evidenze campionari (i dati). Tale congettura che si vuole valutare, testare, viene detta IPOTESI NULLA (H0).

Il passaggio a cui bisogna fare attenzione e che potrebbe confondere è il seguente: i dati del campione sono raccolti ed analizzati per determinare l’evidenza contro l’ipotesi nulla. Quando il campione osservato fornisce sufficiente evidenza del fatto che l’ipotesi nulla sia falsa, questa viene rifiutata in favore della cosiddetta IPOTESI ALTERNATIVA (H1), cioè ciò che si pensa possa essere vero se l’ipotesi nulla dovesse essere falsa(decisione forte). Tuttavia, il mancato rifiuto dell’ipotesi nulla non prova che essa sia vera: quello che si può concludere è che non vi sono evidenze empiriche contrarie ad essa che portano a scartarla (decisione debole).

In questo caso l’ipotesi nulla (la durata media della batteria è pari a 368 minuti) verrebbe scritta come:

H0: µ = µ0 = 368 (µ è la lettera dell’alfabeto greco usata universalmente per indicare la media) versus l’ipotesi alternativa H1 : µ ≠ 368

In questo caso stiamo effettuando un cosiddetto TEST BILATERALE.

Più in generale, quando si parla di test d’ipotesi sui valori medi di una popolazione, vi è la seguente classificazione

test

In quale regione siamo? (e non mi riferisco a quelle italiane)

Nel nostro esempio, la durata media della batteria viene definita STATISTICA TEST, e la regola di decisione (accettare o rifiutare l’ipotesi nulla) è legata al valore che tale statistica test assume o assumerà e alla sua distribuzione. La distribuzione campionaria è spesso una distribuzione statistica nota, come la normale o la t di student, e quindi facendo riferimento a tale distribuzioni è possibile decidere se rifiutare o meno l’ipotesi nulla.

In questo caso la media campionaria ha distribuzione normale, per cui la statistica test (Z) può essere così definita:

DistrMediaCamp

Il numeratore misura di quanto la media osservata differisce dalla media ipotizzata, mentre il denominatore quantifica l’errore standard della media.

A questo punto, la distribuzione campionaria della statistica test viene divisa in due regioni dal cosiddetto valore critico della statistica test: una regione di rifiuto (chiamata anche regione critica) e una regione di accettazione

Regione

Se la statistica test cade nella regione di accettazione, l’ipotesi nulla non può essere rifiutata, al contrario se la statistica test cade nella regione di rifiuto l’ipotesi nulla deve essere rifiutata.

La determinazione di questo valore dipende dall’ampiezza della regione di rifiuto, che è legata al rischio comportato dal prendere una decisione sul parametro alla luce delle sole informazioni campionarie.

ATTENZIONE! Quante volte prendiamo una decisione sbagliata?! 🙁

Tenete sempre a mente che, a qualsiasi conclusione vi porti un ragionamento basato sui teoremi o evidenze statistiche, di includere sempre la famosa letterina ε … l’errore statistico! Cioè le conclusioni a cui si giunge sono affette da un margine di errore.

Nel mondo dei test d’ipotesi questi possono essere di due tipi:

  • Errore di tipo I (errore di prima specie): Rifiutare H0 quando é vera. La probabilità di commettere un errore di prima specie viene indicata con la lettera α, ed è denominata livello di significatività del test. (1-α) rappresenta il coefficiente di confidenza, cioè la probabilità che l’ipotesi nulla non sia rifiutata quando è vera
  • Errore di tipo II (errore di seconda specie): Non rifiutare H0 quando é falsa. La probabilità di commettere un errore di seconda specie viene indicata con β. (1-β) è chiamato potenza del test (indicata con π) e rappresenta la probabilità di rifiutare l’ipotesi nulla quando e’ falsa.

ClassErrori

La migliore soluzione sarebbe un test capace di minimizzare sia le probabilità di commettere gli errori di I e di II tipo. Purtroppo, non è generalmente possibile perseguire un tale obiettivo, in quanto fissata la dimensione campionaria n, una riduzione dell’errore di prima specie si accompagna a un aumento di quello di seconda specie.

La procedura che generalmente si segue è quella di fissare il livello della probabilità di commettere un errore di primo tipo (si stabilisce cioè il livello di significatività a in genere i valori assegnati sono 0.01, 0.05 o 0.1) e nell’individuare poi il test che minimizza la probabilità di commettere un errore di II tipo.

Tornando alle batterie, se si fissa α=0.05, vuol dire che l’area sottesa dalla curva normale in corrispondenza della regione di rifiuto deve essere pari a 0.05.

Ricordiamo che si sta effettuando un test bilaterale (test a due code), pertanto la regione di rifiuto coincide con le due code della distribuzione e quindi l’area 0.05 viene divisa in due aree di 0.025. Cercando queste aree nella tavola della distribuzione normale, troviamo che i valori critici che dividono la regione di rifiuto da quella di accettazione sono –1.96 e +1.96.

regione1

Pertanto la regola decisionale è la seguente:

Rifiutare H0                        se Z< -1,96 oppure se Z> 1,96

Non rifiutare H0                                      altrimenti

Supponiamo che la media campionaria calcolata a partire dal campione di 25 telefoni sia 372 minuti con un errore standard pari a 3

Dunque:

CalcoloZ

e quindi non è possibile rifiutare l’ipotesi nulla, in quanto il valore di Z ricade dentro la regione di accettazione

ZregioneTranquilli siamo giunti alla fine 😛

Ciò che vi ho illustrato altro non sono che le fasi principali della verifica statistica di ipotesi utilizzando il cosiddetto approccio del valore critico.

Ricapitolando:

  1. specificare l’ipotesi nulla e l’ipotesi alternativa
  2. scegliere il livello di significatività α e l’ampiezza campionaria n.
  3. individuare la tecnica statistica a cui fare riferimento e la corrispondente distribuzione campionaria
  4. calcolare i valori critici che separano la regione di rifiuto da quella di accettazione
  5. raccogliere i dati e calcolare il valore campionario della statistica test
  6. prendere la decisione statistica. Se la statistica test cade nella regione di accettazione, l’ipotesi nulla non può essere rifiutata. Se la statistica test cade nella regione di rifiuto, l’ipotesi nulla viene rifiutata.

Sperando sempre di non avervi spaventato troppo, al prossimo post!

KEEP IN TOUCH! 🙂

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.