Cosa hanno in comune la frequenza di utilizzo delle parole di una lingua con il numero di città caratterizzate da una certa popolazione? Oppure, cosa unifica fenomeni come la frequenza di terremoti di una determinata intensità e  la legge di gravitazione universale?

La tentazione è quella di dire nulla. Vi mostreremo in che modo sono, invece, collegati fra loro.

In questo articolo, infatti, si parlerà  di un legge (forse poco nota)  che descrive i precedenti fenomeni insieme con molti altri:  la legge di zipf.

Iniziamo ad approfondire l’argomento  partendo dalla seguente immagine.

Figura A: grafico che mostra il numero di città al variare del numero di abitanti.

Figura A: grafico che mostra il numero di città della terra al variare del numero di abitanti (fonte arXiv.org).

In essa è mostrata  la percentuale di città all’aumentare del numero degli abitanti. Si osserva una cosa scontata: una nazione ha poche città molto popolose e tante medio piccole cittadine. La cosa molto meno scontata è che queste frequenze  abbiano un andamento più o meno simile per tutte le nazioni del mondo e che questo andamento segua all’incirca una legge empirica detta appunto legge di Zipf.

Legge di Zipf: passiamo alle formule

La legge di Zipf   è, infatti, quella legge che descrive  fenomeni che hanno andamenti come quello  rappresentato nella figura A in cui, tra i dati ottenuti, ci sono valori molto grandi e molto piccoli legati fra loro da una relazione matematica.

Per “vedere” meglio i punti sperimentali usiamo un trucco che  gli scienziati applicano spesso quando hanno di fronte dati che variano su scale molto diverse:  trasformiamo la scala in modo da “rimpicciolire ” queste differenze. Per fare questo  rappresentiamo i dati utilizzando la  “scala logaritmica”.

Vi rimandiamo al post sulla rappresentazione dei dati per capire meglio cosa sia una scala logaritmica.
Se rappresentiamo i precedenti dati in scala logaritmica (ovvero applichiamo la funzione logaritmo ai valori delle ascisse e delle ordinate) otteniamo il seguente grafico:

zipf2

Figura B: frequenza delle città al variare del numero di abitanti espressa in scala logaritmica.

Come si vede dalla figura B i valori sembrano disporsi su una retta (o almeno si avvicinano molto ad un andamento simile ad un retta trattandosi di una legge empirica che descrive fenomeni storico/sociali e, all’apparenza, casuali).
La legge matematica che cerchiamo deve essere espressa da una relazione compatibile con questi tipo di comportamento. Essa è espressa dalla seguente funzione:

$$ f(x)= a x^-b = \frac{a}{x^b}.$$

con a e b numeri reali.

Rappresentare i dati in scala logaritmica, infatti,  vuol dire applicare la funzione logaritmo (per esempio in base 10). Se facciamo questo, il logaritmo ha la proprietà di trasformare la curva o grafico che rappresenta una potenza in una retta.
I dati che si comportano più o meno in questo modo sono quelli descritti dalla legge di potenza o di empirica di Zipf.

Esempi di fenomeni che seguono la legge di Zipf sono i più disparati:la frequenza delle parole utilizzate in una lingua (parole come “casa” sono sicuramente molto più frequenti di termini come “mitopoiesi” e “appercezione” tanto per fare un esempio utilizzando termini filosofici) , il numero dei terremoti al variare della intensità, la frequenza della grandezza dei diametri dei crateri.

La figura seguente, tratta dall’articolo citato in bibliografia,  mostra  questi fenomeni .

Figura C: esempi di fenomeni che seguono la legge di Zipf

Figura C: esempi di fenomeni che seguono la legge di Zipf. In particolare: (a) numero di occorrenze  delle parole nel testo Moby Dick (b) numero di citazioni di articoli scientifici (c) frequenza visitatori siti web (d) numero di copie di bestseller vendute (e) numero telefonante  (f) magnitudine dei terremoti (g) diametri dei crateri della luna (i) intensità delle guerre (k) frequenza dei nomi (l) popolazione delle città

Un linguista che non disdegnava la matematica

Il merito dell’aver osservato per primo un fenomeno che segue una legge di potenza è attribuito non ad un matematico ma ad un linguista di nome  Zipf.

Il bello di questo fatto è che il lavoro di questo studioso rappresenta uno dei tanti esempi di applicazione della matematica ad una scienza “non dura”. Ricordiamo, infatti, che per “scienze dure” si intendono discipline, come per esempio la fisica, che fa un elevato uso della matematica studiando   fenomeni che seguono “esattamente” le leggi matematiche tanto da permetterne delle previsioni.

Visto che il blog si chiama “Math is in the air” non ci stupiamo del fatto che la matematica sia nell’aria ovvero che si possa utilizzare per descrivere il mondo. Ecco perché abbiamo deciso di scrivere un post su questo argomento.
Solo per essere precisi, in realtà preliminari osservazioni di un fenomeni che segueno una cosiddetta legge di potenza vengono attribuite a Auerbach ( se siete appassionati di letteratura non è l’Auerbach filologo  anche se sarebbe stato bello che lo fosse per l’idea dell’unità dei saperi) e allo stenografo francese B. Estoup.

In ogni caso il merito di zipf è stato quello di aver portato avanti con convinzione questa idea arrivando a pubblicare un lavoro dal titolo: Human Behaviour and the Principle of Least-Effort (Comportamento umano e il principio del minimo sforzo). 

La cosa ancora più affascinante è che a rifletterci bene anche la ben nota legge di gravitazione universale introdotta da Newton è una legge di potenza con coefficiente pari a 2 infatti la si può scrivere:

$$ F= \frac{Gm \cdot M}{r^2}$$

Limiti di applicabilità

Gli esempi fatti in precedenza relativi a fenomeni di tipo sociale rispettano (come sempre in questi casi) questa legge solo a determinate scale.

Immagine della frequenza delle parole nelle diverse lingue in cui si nota la parte lineare descritta dalla legge di zipf.

Figura D: Immagine della frequenza delle parole nelle diverse lingue in cui si nota la parte lineare descritta dalla legge di zipf (clicca qui per andare all’articolo da cui è tratta l’immagine).

Nella figura D, tratta da un altro articolo citato in fondo a questo post, si nota che l’andamento è rettilineo solo in un determinato intervallo di valori. Non c’è da stupirsi di questo fatto: trattandosi di fenomeni di tipo sociale sarebbe stato sorprendente il contrario!

Perché questa legge?
A questo punto potremmo farci la segue te domanda: perché fenomeni così diversi seguono la stessa legge?
È possibile trovare un qualcosa che accomuna realtà così disparate?
Magari tutti questi fenomeni sono caratterizzati da una stesso fenomeno generativo.
Qui le cose si fanno più complicate e dibattute.

Cercheremo di spiegarvi il tutto il un prossimo post!

Link bibliografici di riferimento:

http://colala.bcs.rochester.edu/papers/piantadosi2014zipfs.pdf

– http://www.geoffkirby.co.uk/ZlPFSLAW.pdf

– http://arxiv.org/pdf/1402.2965.pdf

– http://arxiv.org/pdf/cond-mat/0412004.pdf

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.