Numeri Ritardatari alla Roulette

Un celebre contrasto tra senso comune e Matematica
Stefano Berardi

<<[...] lo zero è appena uscito>>, dissi,
<<di conseguenza, ora non uscirà per un bel pezzo.
Ci sprecherete diverse puntate; aspettate un poco>>.

Dostoevskij, Il Giocatore, Capitolo X.

Introduzione.

Numeri in ritardo. Chiamiamo "ritardo" di un numero alla roulette il numero di estrazioni trascorse senza che quel numero sia uscito. Un numero ha un ritardo di 1 se è appena uscito, un ritardo di 30 se è uscito per l'ultima volta 30 estrazioni fa, e così via.

Una delle convinzioni più diffuse in materia di probabilità e giochi di azzardo è:
        la probabilità che ha un numero di venir estratto
                          dipende dal suo ritardo

In altre parole, si crede che un numero appena estratto abbia meno probabilità di uscire di uno che manca da molto tempo; e che un numero in forte ritardo abbia una probabilità di uscire decisamente più alta degli altri. I giocatori d'azzardo, come ci ricorda Dostoevskij nella citazione qui sopra, evitano di puntare sui numeri appena usciti, e si concentrano su quelli in ritardo, convinti in questo modo di ottenere un vantaggio.

"The coin does not remember". Nonostante sia così diffusa, questa convinzione è falsa. Il Calcolo delle Probabilità, ovvero il ramo della matematica che studia le probabilità che ha un certo evento casuale di verificarsi, parte proprio dall'assunzione opposta:
              la probabilità che ha un numero di venir estratto
         non dipende in alcun modo dalle estrazioni precedenti.
  
Questa convinzione viene riassunta a volte con il motto:
                           the coin does not remember
  Ovvero: una moneta, o una pallina della roulette, non si ricorda cosa ha fatto in precedenza, non ha modo di sapere quali numeri siano in ritardo, e quindi non ha modo di far uscire i numeri in forte ritardo più spesso degli altri.

  Un esperimento per decidere. Confronteremo queste due credenze con un esperimento. Creeremo una simulazione al calcolatore per verificare empiricamente che la frequenza con cui un numero esce non è influenzata dal fatto che sia appena uscito, oppure che non esca da molto tempo.

Una simulazione di una roulette.

Parametri della simulazione. Siano rmin=0, rmax=36 il valore minimo e massimo per gli interi che possiamo estrarre alla Roulette. Scegliamo un elemento El=0 di cui studiare le estrazioni, e il numero Sample = 555 000 di estrazioni che intendiamo fare. Infine, scegliamo i ritardi che intendiamo considerare come esempio: di 30 estrazioni, di 60 estrazioni, fino a un massimo di 100.

[Graphics:Images/index_gr_1.gif]

Questi valori sono stati scelti solo come esempio, e possono essere modificati a piacere. Per esempio possiamo scegliere rmin=0, rmin=1 se intendiamo studiare le estrazioni di testa e croce, e rmin=1, rmax=6 se intendiamo studiare il lancio di un dado. Il programma di simulazione funzionerà in ogni caso (purchè modifichiamo anche i ritardi che intendiamo studiare, scegliendo valori che possano realmente verificarsi nel gioco).

  Definiamo ora un operatore che calcola un numero casuale tra rmin e rmax (diverso ogni volta).

[Graphics:Images/index_gr_2.gif]

Ecco un esempio di 500 numeri tra 0 e 36 (o tra rmin e rmax) estratti usando l'operatore "Roulette". Se rnum è il numero di valori diversi che possiamo estrarre, ogni valore ha una probabilità di essere estratto pari a 1/rnum = 1/37 = 0.027027 ..., ovvero circa il 2.7%.

[Graphics:Images/index_gr_3.gif]
[Graphics:Images/index_gr_4.gif]

Scriviamo in rosso l'elemento atteso, lo 0, e in bianco gli altri.Le linee bianche di numeri saranno i periodi di attesa tra due estrazioni successive di 0.

[Graphics:Images/index_gr_5.gif]
[Graphics:Images/index_gr_6.gif]
[Graphics:Images/index_gr_7.gif]

Spieghiamo ora come costruire le liste delle attese tra due estrazioni successive. Per cominciare, rimpiazziamo ogni estrazione di 0 con un messaggio "SI'", ed ogni estrazione mancata di 0 con il messaggio "NO". Resteranno lunghe serie di "NO" separate da pochi messaggi "SI'".

[Graphics:Images/index_gr_8.gif]
[Graphics:Images/index_gr_9.gif]

Possiamo ora costruire le liste dei tempi di attesa eliminando le estrazioni dello 0, poi contando quanti elementi ha ogni periodo di attesa. Otteniamo una breve lista, con valori che oscillano (molto largamente) intorno al tempo medio di attesa, che è 36.

[Graphics:Images/index_gr_10.gif]
[Graphics:Images/index_gr_11.gif]
[Graphics:Images/index_gr_12.gif]
[Graphics:Images/index_gr_13.gif]

Costruzione della lista LAttesa dei tempi di attesa per l'estrazione di El. Ai fini del nostro esperimento, ripetiamo (senza più entrare nei dettagli) la costruzione della lista dei tempi di attesa,  ovvero dei tempi intercorsi tra due estrazioni di El, per un numero di valori della roulette pari a Sample = 555 000. La minima attesa è 1.

(Per costruire la lista LAttese utilizziamo un ciclo For, e un contatore "attesa", che parte da 1. Ogni volta che l'operatore "Roulette" non estrae El viene incrementato di 1. Ad ogni estrazione di El, "attesa" contiene il numero di estrazioni che abbiamo atteso El: questo valore viene aggiunto alla lista LAttese, mentre il contatore "attesa" riparte da 1. Alla fine, LAttese contiene la lista di tutti i tempi di attesa per la prima estrazione di El, o tra due estrazioni successive di El.)

[Graphics:Images/index_gr_14.gif]
[Graphics:Images/index_gr_15.gif]

Il numero di estrazioni previste dell'elemento El è Sample/rmun (è pari alla dimensione Sample del campione, moltiplicato per la probabilità (1/rnum) che ha El di essere estratto).

[Graphics:Images/index_gr_16.gif]
[Graphics:Images/index_gr_17.gif]
[Graphics:Images/index_gr_18.gif]

Il numero di estrazioni effettivamente verificate di El è pari al numero dei tempi di attesa per una estrazione di El. E' quindi pari alla lunghezza A della lista delle attese. Risulta tanto più vicino al precedente quanto più grande è il campione considerato.

[Graphics:Images/index_gr_19.gif]
[Graphics:Images/index_gr_20.gif]

  Frequenze relative e assolute. Costruiamo ora la lista delle frequenze dei tempi di attesa. Cioè contiamo, per ogni i tra 1 e un certo valore massimo, quante volte abbiamo dovuto attendere un'estrazione di El per un tempo pari ad i. Ovvero, contiamo quante volte il numero i compare nella lista delle attese:

[Graphics:Images/index_gr_21.gif]

  Il valore di posto i nella lista Freq, indicato con Freq[[i]],viene detto frequenza assoluta di un'attesa di lunghezza i. Si dice invece frequenza relativa la proporzione tra la frequenza assoluta e il numero totale A delle attese. Ecco le frequenze relative dei tempi di attesa 1, 2, 3, ... . Notiamo che esse sono decrescenti, più un ritardo è alto meno è probabile che si verifichi.

[Graphics:Images/index_gr_22.gif]
[Graphics:Images/index_gr_23.gif]

La frequenza relativa di i dà (se moltiplicata per 100) la percentuale con cui il valore i compare nella lista.

Legge dei grandi numeri. La legge dei grandi numeri prevede che, al crescere del campione, la frequenza relativa tende ad avvicinarsi alla probabilità p di quell'evento. La frequenza assoluta tenderà a p×Sample, la probabilità dell'evento moltiplicata per il numero degli eventi.

La probabilità di estrazione di un numero è indipendente dal suo ritardo.

  Una prima verifica del principio "the coin does not remember". Calcoliamo la frequenza (relativa) con El è stato estratto subito dopo una precedente estrazione di El. Come abbiamo detto, essa è uguale al numero dei tempi di attesa 1, diviso per il numero A di estrazioni di El.

[Graphics:Images/index_gr_24.gif]
[Graphics:Images/index_gr_25.gif]

Come si è detto, comunemente si crede che, essendo El appena uscito, la sua probabilità di uscire di nuovo sia più bassa del normale. Verifichiamo, invece, che la frequenza (relativa) con cui El viene estratto dopo essere appena stato estratto è prossima a 1/rmun = 1/37 = 2.7% : ovvero, la normale probabilità di estrazione di El.

[Graphics:Images/index_gr_26.gif]
[Graphics:Images/index_gr_27.gif]

Possiamo estendere il controllo a tutte le previsioni fatte dal calcolo delle probabilità sui tempi di estrazione. Secondo il calcolo delle probabilità, la formula che calcola la frequenza (assoluta prevista) di un'ulteriore attesa pari ad x, quale che sia il ritardo già accumulato nell'estrazione di El, è la seguente.

[Graphics:Images/index_gr_28.gif]

(La formula si ottiene come segue. La probabilità di un ritardo pari ad x è la probabilità (1/rnum) che l'elemento x venga estratto una volta, moltiplicata per la probabilità [Graphics:Images/index_gr_29.gif] che l'elemento non venga estratto per x-1 volte. La frequenza assoluta prevista si ottiene moltiplicando la probabilità per A, il numero dei ritardi).

Disegnamo ora il grafico delle frequenze assolute dei tempi di attesa previste (in blu) e verificate (in rosso). Vedremo una corrispondenza tra previsioni e risultati, tanto più stretta quanto è grande il campione considerato.

[Graphics:Images/index_gr_30.gif]
[Graphics:Images/index_gr_31.gif]
[Graphics:Images/index_gr_32.gif]

[Graphics:Images/index_gr_33.gif]

Una seconda verifica del principio "the coin does not remember". Consideriamo ora cosa succede quando l'elemento El è in ritardo di a=Rit1=30 estrazioni.
Costruiamo una nuova lista LAttese2, costituita dalle attese nell'estrazione di El una volta che sia già avvenuto un ritardo a=Rit1=30. Scrivendo 1, 2, 3, ... in LAttese2 indicheremo un ritardo di a seguito da un'attesa di 1, 2, 3, ..., dunque un'attesa totale di a+1, a+2, a+3, ... .
Otteniamo LAttese2 sottraendo a da ogni valore di LAttese, e rimpiazzando con 0, e in seguito eliminando, ogni valore <= a, di modo da ottenere una lista che contenga solo più i ritardi a+1, a+2, ....

[Graphics:Images/index_gr_34.gif]
[Graphics:Images/index_gr_35.gif]

A conferma di ciò che stiamo dicendo, confrontiamo i primi elementi di LAttese e LAttese2.

[Graphics:Images/index_gr_36.gif]
[Graphics:Images/index_gr_37.gif]
[Graphics:Images/index_gr_38.gif]
[Graphics:Images/index_gr_39.gif]

Il numero di estrazioni con un ritardo > Rit1=30 è pari alla lunghezza A2 della lista LAttese2:

[Graphics:Images/index_gr_40.gif]
[Graphics:Images/index_gr_41.gif]

Calcoliamo la frequenza (relativa) con cui El è stato estratto subito dopo un ritardo pari ad Rit=30. Esso è uguale al numero di attese uguali ad 1 in LAttese2, diviso per la lunghezza A2 della lista.

[Graphics:Images/index_gr_42.gif]
[Graphics:Images/index_gr_43.gif]

Nonostante l'estrazione di El sia in ritardo di a, la frequenza con cui El viene estratto dopo un'attesa di 1 è di nuovo prossima a 1/rmun = 1/37 = 2.7%, ovvero la normale probabilità di estrazione di El. Il ritardo non ha reso El più frequente.

[Graphics:Images/index_gr_44.gif]
[Graphics:Images/index_gr_45.gif]

Disegnamo il grafico delle frequenze dei tempi di attesa dopo un ritardo > a, previste (in blu) e verificate (in rosso). La previsione ripete uguali le stesse probabilità previste quando il ritardo era nullo. Ciò nonostante, le frequenze verificate sono vicine a quelle previste.

[Graphics:Images/index_gr_46.gif]
[Graphics:Images/index_gr_47.gif]
[Graphics:Images/index_gr_48.gif]
[Graphics:Images/index_gr_49.gif]

[Graphics:Images/index_gr_50.gif]

In altre parole, abbiamo verificato empiricamente che la probabilità di un ulteriore ritardo di i nell'estrazione di el dipende solo da i, e non dal fatto che l'elemento el è in ritardo di a. Una volta che il ritardo è pari ad a, la probabilità che il ritardo cresca fino ad (a+i) è la stessa che partendo da 0 si arrivi ad un ritardo pari ad i.

L'unica differenza rispetto al grafico precedente è che l'irregolarità del grafico delle frequenze reali aumenta: ciò è dovuto al fatto che i tempi di attesa > a sono molti meno di tutti i tempi di attesa, e che su un campione più piccolo le oscillazioni casuali sono più marcate.

Ripetiamo ora, per conferma, il calcolo delle frequenze a partire da un ritardo maggiore: a=Rit2=60. Riotteniamo gli stessi risultati (la frequenza di estrazione di El non dipende dal ritardo), ma con approssimazioni ancora maggiori (il campione è ulteriormente diminuito).

[Graphics:Images/index_gr_51.gif]
[Graphics:Images/index_gr_52.gif]

Ecco il numero delle attese > Rit2=60, e la frequenza con cui, dato un ritardo pari a Rit2=60, El viene estratto al primo tentativo. Di nuovo, la frequenza (relativa) con cui El viene estratto è prossima a 1/rmun = 1/37 = 2.7% : ovvero, la normale probabilità di estrazione di El, nonostante il lungo ritardo nell'estrazione.

[Graphics:Images/index_gr_53.gif]
[Graphics:Images/index_gr_54.gif]
[Graphics:Images/index_gr_55.gif]
[Graphics:Images/index_gr_56.gif]
[Graphics:Images/index_gr_57.gif]
[Graphics:Images/index_gr_58.gif]

Confrontiamo di nuovo con le frequenze reali dei tempi di attesa (in rosso) con quelle previste (in blu), supponendo già avvenuto un ritardo pari a Rit2=60. Notiamo una maggiore irregolarità nel grafico delle frequenze reali.

[Graphics:Images/index_gr_59.gif]
[Graphics:Images/index_gr_60.gif]
[Graphics:Images/index_gr_61.gif]
[Graphics:Images/index_gr_62.gif]

[Graphics:Images/index_gr_63.gif]

Conclusioni.

Non ci sono dubbi (ogni esperienza lo conferma) che le assunzioni del calcolo delle probabilità siano corrette, e che la probabilità che un numero venga estratto non dipenda dalle estrazioni precedenti. Il motto "the coin does not remember" è perfettamente valido.
Ci si può chiedere allora perchè la credenza opposta sia così diffusa, e largamente maggioritaria. A parere di chi scrive, ci possono essere due ragioni. Per un giocatore d'azzardo, c'è la volontà di attaccarsi a qualunque convinzione dia una speranza, per quanto poco fondata essa sia; questo atteggiamento non può essere discusso razionalmente.

Un ragionamento errato. C'è un secondo motivo per credere che numeri in ritardo escano più spesso. E' fondato sul seguente ragionamento (errato ma convincente). E' vero che i ritardi, poniamo, di 80 estrazioni sono (in proporzione alla totalità delle estrazioni) rari. E' vero che i ritardi più alti, diciamo di 90 estrazioni sono ancora più rari. Verrebbe da concludere che se un numero ha già tardato 80 estrazioni, allora è difficile che ne tardi più di 90, e quindi sta per uscire.

  Perché questo ragionamento è errato? Perché manca di senso della proporzione. E' vero che i ritardi di 90 estrazioni sono rari. Ma questo non significa che, una volta che il numero sia in ritardo di 80 estrazioni, sia difficile che arrivi fino a 90. Infatti, la frequenza con cui un numero in ritardo di 80 arriva a un ritardo di 90 è data dal rapporto tra i casi favorevoli (il numero delle attese > 90) e i casi complessivi (il numero delle attese > 80). Anche se le attese > 90 o > 80 sono (in proporzione a tutte le attese) poche, il loro rapporto (dunque la frequenza con cui un ritardo di 80 diventa un ritardo di 90) può essere alto. Nel ragionamento precedente abbiamo considerato solo il fatto che i ritardi > 90 sono rari. Ci siamo dimenticati di considerare il fatto che, in proporzione ai ritardi > 80, i ritardi > 90 non sono affatto rari, e non è infrequente che capitino.
Insomma, abbiamo considerato i valori delle quantità in gioco in assoluto, anzichè in proporzione. Ecco l'errore.


Converted by Mathematica      March 2, 2003