Passo 1. Assegnate a Mreal una matrice a scelta.
![[Graphics:Images/index_gr_2.gif]](Images/index_gr_2.gif)
I dati in ingresso di questo file sono contenuti nella matrice Mreal. Come esempio considereremo il caso Mreal =
1 3 4 1
6 4 5 3
3 2 3 4
10 13 9 14
5 4 5 2
1 1 0 2
Questo Notebook calcola la correlazione statistica per ogni possibile matrice Mreal data in ingresso.
Potete leggere una matrice anche da file, usando la macro MathTable[nomefile,"matrix"] (si trova nel sito del corso, nel file <<MathMacro.txt, ).
Passo 2. Assegnate (usando il comando Dimensions[.]) alla coppia {n,m} il numero di righe e colonne di Mreal.
![[Graphics:Images/index_gr_3.gif]](Images/index_gr_3.gif)
Stabilire se esiste una relazione tra due dati é un problema comune nelle scienze applicate. In questo file spiegheremo come calcolare un certo indice di correlazione statistica Φ.
Un primo esempio (non svolto). Potremmo voler stabilire se esiste una correlazione tra i numero di giorni di malattia per anno degli impiegati di una certa ditta, e la quantità di esposizione, negli anni, di tali impiegati a certe sostanze, il cui effetto sulla salute non é ben noto. In assenza di correlazione statistica (Φ prossimo a 0), considereremo tali esposizioni non pericolose; se Φ é prossimo al massimo, sapremo invece che é necessario studiare il legame tra esposizione alla sostanza e malattie.
Un secondo esempio (da svolgere). Calcoleremo l'indice di correlazione statistica, in una terza scientifico, tra il voto finale di matematica (3,4,5,6,7 oppure 8) preso da un ragazzo e la sezione (A,B,C,D) frequentata. In assenza di correlazione (Φ prossimo a 0), considereremo che le diverse classi siano ugualmente difficili (o egualmente facili). Nel caso di Φ prossimo al massimo, invece, sapremo che in certe classi si tende a prendere certi voti e non certi altri. (Questo, però, non ci dirà ancora in quali classi ciò accade. Sapere che esiste un legame non vuol ancora dire sapere qual'é.)
I dati nel nostro esempio. Nel nostro esempio, i voti possibili sono sei (3,4,5,6,7,8): li numeriamo da 1 a 6. Le sezioni possibili sono 4 (A,B,C,D): le numeriamo da 1 a 4. In Mreal[[i,j]] troviamo il numero di studenti che hanno preso il voto numero i nella sezione numero j. Ricalcolate ora Mreal.
![[Graphics:Images/index_gr_5.gif]](Images/index_gr_5.gif)
Il significato di Mreal. Sempre nell'esempio dato, la prima riga contiene il numero degli studenti che hanno preso il primo voto nell'elenco, ovvero che hanno preso "3" sulla pagella. Sono 1 in Terza A, 3 in Terza B, 4 in Terza C, 1 Terza D.
L'ultima riga contiene il numero degli studenti che hanno preso il sesto voto nell'elenco, ovvero che hanno preso "8".
Passo 3. Ecco ora un metodo di calcolo di Φ, come al solito senza commenti. Per prima cosa, definiamo due funzioni TotRiga[i] e TotCol[j], che calcolano il totale della riga numero i e della colonna numero j.
![[Graphics:Images/index_gr_7.gif]](Images/index_gr_7.gif)
Passo 4. Calcoliamo ora la somma Tot dei valori di Mreal.
![[Graphics:Images/index_gr_8.gif]](Images/index_gr_8.gif)
A partire dalla tabella con i dati reali, ne costruiremo un'altra, ideale, con la situazione che avremmo se i dati voti/sezioni fossero del tutto indipendenti, supponendo però che il numero di studenti per ogni voto e per ogni classe sia lo stesso. Φ sarà una misura della distanza tra la tabella reale e la sua versione ideale. Se Φ é prossima allo zero, le due tabelle sono molto simili, e quindi i dati voti/sezioni nella tabella reale sono pressocché indipendenti tra loro.
Passo 5. Definire una matrice Mideal con, all'incrocio della riga i e colonna j, il prodotto del totale della riga i, per il totale della colonna j, diviso il totale Tot di Mreal.
![[Graphics:Images/index_gr_10.gif]](Images/index_gr_10.gif)
Passo 6. Per calcolare Φ dobbiamo costruire una matrice Mscarti, contenente le differenze, elemento per elemento, di Mreal e Mideal.
![[Graphics:Images/index_gr_12.gif]](Images/index_gr_12.gif)
Passo 7. Dobbiamo definire un'ultima matrice, Mchi, che contiene i quadrati degli elementi di Mscarti, divisi per l'elemento di ugual posto in Mideal.
![[Graphics:Images/index_gr_14.gif]](Images/index_gr_14.gif)
Passo 8. La somma degli elementi di Mchi dà un valore, chiamato χ2 o "chi quadro".
![[Graphics:Images/index_gr_16.gif]](Images/index_gr_16.gif)
Passo 9. Dividendo χ2 per il totale di Mreal otteniamo l'indice di correlazione Φ:
![[Graphics:Images/index_gr_18.gif]](Images/index_gr_18.gif)
Passo 10. Il massimo di Φ per una data matrice é min(n,m)-1.
![[Graphics:Images/index_gr_20.gif]](Images/index_gr_20.gif)
Nell'esempio, il valore calcolato per Φ è meno di 0.1, mentre il massimo di Φ risulta (min(4,6)-1)=3.
Conclusioni nell'esempio scelto. Voti e sezioni risultano pertanto privi di rapporto significativo; le classi terze di quella scuola e di quell'anno sono, all'incirca, della stessa difficoltà.