In sostanza ci indicano quanto differiscano tra loro un insieme di valori numerici.
Volendo sintetizzare un insieme di modalità si possono usare una o più medie, ma la descrizione risulterebbe sommaria se non andassimo a quantificare la variabilità dell'insieme in esame.
Nel caso di modalità tutte uguali fra loro, ovvero di variabilità nulla, tutti gli indici di variabilità produrranno zero, ma maggiore sarà la diversità tra le modalità, maggiori saranno i valori ricavati come indici di variabilità.
Partiamo da un esempio:
Si immagini un gioco a premi che si svolga da 10 anni e preveda i seguenti premi:
estratto | € |
---|---|
1º | 1000 |
2º | 200 |
3º | 100 |
Aggiungiamo che ogni anno, siano stati stampati e venduti 100 biglietti per partecipare al gioco.
Ora ci si chiede:
Le risposte saranno:
Come si vede, nel primo caso la media formirsce un valore estremamente significativo, meno nel secondo e per il terzo, la media fornisce una sintesi assai poco indicativa, infatti, come evidenziato parlando della media aritmetica, essa perde di significato all'aumentare della variabilità dei valori sintetizzati.
Sia per determinare la significatività della media aritmetica, sia in generale, ovvero per descrivere meglio un insieme di valori numerici, vediamo come si misura la variabilità di una distribuzione statistica.
In generale distinguiamo tra indici di variabilità assoluti e relativi:
assoluti | relativi |
---|---|
campo di variazione | coefficiente di variazione |
scarto semplice mediano | |
scarto semplice medio | |
varianza | |
deviazione standard (o scarto quadratico medio) |
Il campo di variazione (detto anche intervallo di variabilità), è la differenza tra il valore massimo e quello minimo. Essendo una differenza, non mi dispiace indicarlo con la lettera greca delta maiuscola (Δ).
campo di variazione |
---|
Il campo di variazione è un indice di variabilità debole visto che tiene in considerazione soltanto due modalità, la maggiore e la minore, inoltre è suscettibile a valori eccezionali che ne inficiano la significatività.
Osservando la spesa giornaliera (in €) di un gruppo di persone si è ricavata la seguente distribuzione unitaria:
x |
---|
7 |
8 |
10 |
11 |
14 |
16 |
17 |
19 |
20 |
33 |
Il campo di variazione si calcola così:
Ovvero le modalità ricadono tutte in un intervallo di 26€, ma graficamente:
si nota meglio che la modalità 33€, in quanto eccezionale porta il campo di variazione da 13€ (20 - 7) a 26€ pregiudicandone la significatività.
Si aggiunga che se le 10 modalità fossero state tutte 7€ esclusa una a 33€, oppure tutte 33€ esclusa una a 7€, il campo di variazione sarebbe stato sempre 26€.
Si rimanda ad altra fonte la trattazione del più stabile campo di variazione interquartile.
Per ottenere un indice di variabilità che consideri tutte le modalità, ci si riferisce ai loro scarti da un indice di posizione centrale.
Con scarto (detto anche deviazione o scostamento) intendiamo la distanza che separa ciascuno dei dati da un medesimo valore centrale che di norma è la loro media aritmetica.
Disponendo di n modalità, otterremo n scarti, visto che ciascuna modalità si scosta dalla media di una quantità pari alla loro differenza:
scarto = x - media.A questo punto, tutti i valori inferiori alla media avranno uno scarto negativo e tutti gli altri uno positivo.
Portando ad esempio la seguente distribuzione unitaria che riporta il numero di promossi in dieci sessioni di uno stesso esame:
sessione | promossi |
---|---|
1ª | 12 |
2ª | 9 |
3ª | 10 |
4ª | 14 |
5ª | 16 |
6ª | 18 |
7ª | 16 |
8ª | 10 |
9ª | 18 |
10ª | 17 |
Σ | 140 |
Lla media aritmetica dei promossi, si ottiene ; si calcolano quindi gli scarti così:
x | scarto |
---|---|
12 | 12 - 14 = -2 |
9 | 9 - 14 = -5 |
10 | 10 - 14 = -4 |
14 | 14 - 14 = 0 |
16 | 16 - 14 = 2 |
18 | 18 - 14 = 4 |
16 | 16 - 14 = 2 |
10 | 10 - 14 = -4 |
18 | 18 - 14 = 4 |
17 | 17 - 14 = 3 |
Σ | 0 |
Ricordando infatti che la media aritmetica è quel valore che se sostituito ai dati produce la stessa somma, è facilmente dimostrabile che la somma degli scarti relativi è nulla:
Come appena precisato parlando degli scarti dalla media, essendo nulla la loro somma è ovviamente nulla anche la loro media, ergo, lo scarto semplice medio relativo è un valore nullo per le proprietà della media aritmetica.
Considerando però gli scarti in valore assoluto otterremo lo scarto (o scostamento) semplice medio.
In sostanza è la media aritmetica degli scarti assoluti.
semplice | ponderato |
---|---|
Portiamo ad esempio la distribuzione unitaria vista sopra riguardante il numero di promossi in dieci sessioni di un medesimo esame:
sessione | promossi |
---|---|
1ª | 12 |
2ª | 9 |
3ª | 10 |
4ª | 14 |
5ª | 16 |
6ª | 18 |
7ª | 16 |
8ª | 10 |
9ª | 18 |
10ª | 17 |
Σ | 140 |
Essendo la media di 10 promossi, calcoliamo lo scarto semplice medio assoluto così:
sessione | promossi | scarto relativo | scarto assoluto |
---|---|---|---|
1ª | 12 | 12 - 14 = -2 | |12 - 14| = 2 |
2ª | 9 | 9 - 14 = -5 | |9 - 14| = 5 |
3ª | 10 | 10 - 14 = -4 | |10 - 14| = 4 |
4ª | 14 | 14 - 14 = 0 | |14 - 14| = 0 |
5ª | 16 | 16 - 14 = 2 | |16 - 14| = 2 |
6ª | 18 | 18 - 14 = 4 | |18 - 14| = 4 |
7ª | 16 | 16 - 14 = 2 | |16 - 14| = 2 |
8ª | 10 | 10 - 14 = -4 | |10 - 14| = 4 |
9ª | 18 | 18 - 14 = 4 | |18 - 14| = 4 |
10ª | 17 | 17 - 14 = 3 | |17 - 14| = 3 |
Σ | 140 | 0 | 30 |
Quindi lo scarto semplice medio assoluto, vale
Applicando la formula: