La Survey

Io e la Matematica” è il titolo della survey, lanciata da Math is in the Air in collaborazione con  i Professori R. Zan e P. Di Martino del Dipartimento di Matematica della Facoltà di Pisa per analizzare cosa pensano le persone della Matematica e come si rapportano ad essa.
La survey si è svolta dal 26/10/2017 al 08/12/2017 mediante un apposito form online.

logo

Il questionario è composto da 10 domande (alcune a risposta chiusa, altre a risposta aperta):

  1. Qual è la tua età?
  2. Quale è il tuo grado di istruzione?
  3. Quale scuola hai frequentato (o stai frequentando)?
  4. Con quali aggettivi (da 1 a 3) descriveresti la Matematica?
  5. Quali emozioni associ alla Matematica?
  6. Descrivi sinteticamente il tuo rapporto con la Matematica
  7. Descrivi il tuo rapporto con la Matematica con una sola parola
  8. Dell’insegnamento della Matematica cosa non hai apprezzato?
  9. In quale momento della tua vita hai “amato” di meno la Matematica?
  10. In quale momento della tua vita, invece, l’hai amata di più?

Hanno partecipato al questionario 3.491 persone, di cui 3.232 in maniera completa. Ai fini dell’analisi è stata considerata la popolazione che ha risposto a tutte le domande del questionario.

L’analisi

L’analisi dei dati è stata effettuata mediante il software statistico R, richiamando alcuni servizi esterni (ad esempio TreeTagger per la parte di POS Tagging).

L’infografica è stata invece realizzata tramite programmi di grafica.

Statistiche Generali

In prima istanza è stata analizzata la platea coinvolta, secondo le dimensioni Età, Titolo di Studio e Scuola Superiore.

Da notare come la maggior parte dei partecipanti abbia un età inferiore ai 18 anni (pertanto il diploma di Terza Media come Titolo di Studio). Questo è un aspetto importante in quanto la maggior parte delle risposte alle domande provengono da ragazze e ragazzi che vivono ancora quotidianamente lo studio della Matematica nelle scuole superiori (su tutte il Liceo Scientifico).

Età

age_by_group

 

table_età

Titolo di Studio

educations_by_group

table_titolo

 

Scuola Superiore

school_by_group

table_scuola

 

Sentiment Analysis

Per effettuare la sentiment analysis sono stati utilizzati due approcci:

  1. utilizzo delle Dandelion API (acronimo di Application Programming Interface, sono delle librerie di funzioni che permettono a un programmatore di interagire con un programma o una piattaforma software richiamandone alcuni servizi da utilizzare. Rendere disponibile un set di API di un software significa dare la possibilità ad altri di interagire con la sua piattaforma e, soprattutto, estendere le funzioni e le caratteristiche della struttura base della stessa. In sostanza, le API sono un valido strumento per diffondere un programma lasciando ad altri stabilire la modalità di interazione.} per Text Analytics
  2. utilizzo di dataset di parole Negative/Positive

Il sentiment rispetto alla Matematica è stato misurato con il primo approccio, prendendo in considerazione le risposte aperte alla domanda Descrivi sinteticamente il tuo rapporto con la Matematica.
In sostanza viene richiamato un servizio online (il calcolo del Sentiment) al quale vengono passati dei dati (le risposte alla domanda in questione) e questo restituisce per ciascuna risposta il sentiment associato.

In particolare è emerso che il 40% dei partecipanti ha/ha avuto un pessimo rapporto con la Matematica.

table_sentiment

Successivamente è stato misurato il sentiment per i vari aggettivi forniti come risposta alla domanda Con quali aggettivi (da 1 a 3) descriveresti la Matematica?
Prima di effettuare il calcolo del Sentiment degli aggettivi è stata effettuata una pulizia delle risposta da tutte le parole che non fossero aggettivi. In questo caso è stata effettuata un’analisi grammaticale delle risposte, anche detta Part of Speech (POS) Tagging.
Il POS Tagging consiste nell’assegnazione a una parola della categoria morfo-sintattica cui questa appartiene. Le categorie principali sono nomi, verbi, avverbi, articoli, pronomi e così via.
Nel nostro caso questa classificazione preliminare è stata effettuata con un programma di Tagging, il TreeTagger prodotto e rilasciato dal Center for Information and Language Processing dell’Università Ludwig-Maximilians di Monaco di Baviera.

Successivamente il set di aggettivi è stato confrontato con un dataset di parole già classificate secondo il sentiment Positivo/Negativo.

AdjNegWordCloud

 

AdjPosWordCloud

Al fine di valutare con facilità gli aggettivi positivi e negativi maggiormente ricorrenti, sono state realizzate due word cloud distinte. Una word cloud è una rappresentazione grafica di dati testuali, usata in particolare per la visualizzazione di parole chiave sul web o di testo in forma libera. Le modalità di visualizzazione di una word cloud variano a seconda della particolare necessità.

Il criterio adottato in questa analisi consente una rapida visione degli aggettivi maggiormente frequenti: viene dapprima assegnata una dimensione al font per la rappresentazione di ciascun aggettivo in maniera direttamente proporzionale alla frequenza dello stesso; successivamente i termini vengono collocati, a partire dal centro della cloud, seguendo l’ordine decrescente delle frequenze.

Emergono aspetti quali l’utilità e il fascino (interessante, affascinante, intrigante); inoltre è significativo come ricorrano parecchi termini legati al divertimento che scaturisce dallo studio e la pratica della Matematica (ad esempio divertente, giocoso, piacevole).

In chiave negativa sono invece da considerare aspetti come la complessità, il rigore e l’eccessivo formalismo dai quali scaturisce una repulsione verso la Matematica, che viene avvertita inoltre come incomprensibile, pesante e impossibile.

D’altra parte, anche in questo caso, ci sono analisi controverse: come discusso nella ricerca di Di Martino e Zan, l’aggettivo ’difficile’ non è associato sempre a sentimenti negativi. La disposizione emozionale rispetto alla difficoltà dipende molto dalla percezione di competenza in matematica che il soggetto ha: riuscire (o percepire di riuscire) in un ambito difficile è tipicamente motivo di grande soddisfazione.

 

Osservazione

La differenza dei due approcci sta nel fatto che un servizio online ha a sua disposizione un set molto grande di esempi sui quali basarsi per effettuare il calcolo del Sentiment, mentre un dataset di parole già classificate, per quanto vasto, potrebbe invece avere qualche mancanza. Inoltre, in alcuni casi, una singola parola può avere un significato diverso a seconda del contesto.

Indipendenza e Significatività Statistica

Si è voluto inoltre analizzare la relazione tra il Sentiment e le dimensioni relative a Titolo di Studio, Età e Scuola. Viene studiata in particolare la dipendenza del Sentiment rispetto alle altre dimensioni.

Nel nostro caso l’indipendenza è stata misurata utilizzando il test del  $$\chi$$ quadrato

e per ciascuna coppia VARIABILE-SENTIMENT è stato calcolato il p-value per verificare la significatività statistica della relazione (valore di soglia fissato a $$\alpha = 0.05$$).

Per significatività statistica si intende invece, in termini semplicisti, che ciò che viene osservato difficilmente è dovuto al caso. Il livello di significatività di un test viene scelto dallo sperimentatore, ma di solito viene scelto un livello di probabilità pari al $$5%$$. Questa probabilità, detta p-value, rappresenta una stima quantitativa della probabilità che le differenze osservate siano dovute al caso. Un valore di p vicino a $$0$$ significa che c’è una bassa probabilità che la differenza osservata sia dovuta al caso.

La variabile Sentiment risulta essere in una relazione di dipendenza rispetto alle dimensioni Età, Titolo di Studio e Scuola, in quanto i valori di significatività risultano essere tutti inferiori al valore soglia da noi stabilito.

Un aspetto particolarmente interessante è l’analisi della relazione che lega i diversi valori del Sentiment a quelli delle altre variabili.

Nei seguenti grafici viene mostrata la natura della dipendenza del Sentiment rispetto alle tre dimensioni Età, Titolo di Studio e Scuola, ossia come i 3 valori del Sentiment (negative, neutral, positive) si relazionano ai rispettivi delle altre variabili.

A ciascuna coppia di possibili valori viene associato un valore numerico (residuo) che rappresenta l’intensit`a della relazione tra la coppia di valori delle variabili in esame.

I valori dei grafici mostrati di seguito vanno letti nel seguente modo:

  • Pallini positivi in blu: valori positivi in una cella significano un’attrazione dei valori della riga con quelli della colonna di riferimento.
  • Pallini negativi in rosso: valori negativi stanno a significare una repulsione del valore della riga con il valore della colonna.

chisq_sch chisq_age chisq_edu

Ad esempio, nel grafico che analizza la dipendenza tra i valori dell’Età e quelli del Sentiment, emerge come le persone di età inferiore ai 18 anni abbiano un sentiment principalmente negativo (pallino blu intenso nella cella negative – minore di 18 anni) rispetto a quello positivo (pallino rosso intenso nella cella positive – minore di 18 anni); d’altra parte persone con età superiore ai 51 anni tendono a mostrare un atteggiamento prevalentemente positivo verso la Matematica (pallini blu nelle celle positive – tra 51 e 60 e positive – maggiore di 60 e pallini rossi nelle rispettive celle del sentiment negativo). In questo caso è possibile anche una interpretazione sul particolare campione: nel caso degli studenti, sono state coinvolte intere classi; gli over 50 sono invece persone che hanno deciso di partecipare probabilmente da frequentatori del sito www.mathisintheair.org e quindi interessati alla matematica.

Dagli altri 2 grafici emerge in maniera abbastanza netta un forte apprezzamento della Matematica da parte di chi ha conseguito una specializzazione scientifica e una notevole avversione da parte di partecipanti che frequentano o hanno frequentato scuole superiori a indirizzo umanistico (tra tutte il Liceo Linguistico).

Text Analysis sull’Insegnamento

Una nota di rilievo è stata data alle risposte fornite da parte dei ragazzi sotto i 18 anni alla domanda Dell’insegnamento della Matematica cosa non hai apprezzato?

A tale scopo sono stati raccolti tutti i trigrammi più rilevanti.

Per n-gramma si intende una sequenza contigua di n parole (token) in una data sequenza di testo. Pertanto sono state raccolte tutte le sequenze contigue formate da 3 token. Successivamente, per ciascuna sequenza, è stato effettuato il POS tagging dei 3 singoli token della sequenza. Infine è stato calcolato un indice di significatività testuale (IS Index, in cui intervengono la frequenza della sequenza, la frequenza dei singoli token costituenti la sequenza e il POS Tagging di questi ultimi).

WordCloud_Trigrams_18

Dall’analisi emerge in particolare come vengano percepiti la velocità delle spiegazioni, la ripetitività degli esercizi e la mole di formule da dover imparare.

Infografica

Di seguito l’infografica realizzata per la rappresentazione dei risultati della Survey

IoElaMatematica

 


 

Ringraziamenti
Desideriamo ringraziare tutti coloro che hanno partecipato a questa indagine.
In particolare i docenti e le scuole che hanno supportato il progetto.
Fra i diversi istituti partecipanti segnaliamo i seguenti di cui abbiamo avuto notizia dell’adesione da parte di singoli docenti o di tutto l’Istituto:
– Liceo Talete di Roma, Liceo Machiavelli Roma, Liceo R. Russell di Roma, Istituto Carlo e Nello Rosselli di Aprilia, Libero Cavour di Roma, I.S.S. Darwin di Roma.

CC BY-NC-SA 4.0
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.