Varianza
Da Wikipedia, l'enciclopedia libera.
In statistica la varianza è un indice di dispersione. Viene solitamente indicata con σ2 (dove σ è la deviazione standard).
L'espressione per la varianza, nell'ambito della statistica descrittiva, è:
dove μ rappresenta la media aritmetica dei valori xi.
Nel caso si tratti di valori ponderati, allora la definizione diventa:
(in questo caso μ è la media aritmetica ponderata).
La varianza è un indicatore di dispersione in quanto è nulla solo nei casi in cui tutti i valori sono uguali tra di loro (e pertanto uguali alla loro media) e cresce con il crescere delle differenze reciproche dei valori.
Trattandosi di una somma di valori (anche negativi) al quadrato, è evidente che la varianza non sarà mai negativa.
Più in generale, se X è una variabile casuale si definisce la sua varianza come:
Essendo E[X] il valore atteso della variabile casuale X. Si osservi che essendo la variabile casuale (X − E[X])2 sempre positiva, il suo valore atteso, ovvero la varianza di X, sarà anch'esso positivo.
Se μ1 e μ2 sono i momenti semplici di ordine 1 e 2 di X la formula della varianza si riduce a:
La Disuguaglianza di Tchebicheff garantisce che almeno il 75% dei valori assunti da X sono compresi tra μ-2σ e μ+2σ e almeno l'88% tra μ-3σ e μ+3σ.
[modifica] Esempio
Se abbiamo i seguenti cinque valori equiprobabili: -9,-1,1,7,22 ricaviamo che hanno la media
e la varianza
pertanto la deviazione standard dei suddetti cinque valori è:
In pratica la varianza risulta essere una misura della dispersione dei valori ottenuti in n prove, ovvero maggiormente differenti sono i valori ottenuti in n prove (ad esempio voti differenti in una prova d'esame) e maggiore sarà il valore della varianza. Per l'appunto è chiamata anche indice di dispersione poiché offre una indicazione sull'addensamento dei valori della variabile attorno al valor medio. Se dunque abbiamo una varianza alta in una prova d'esame questo vorrà dire che ci saranno voti molto differenti fra di loro, dunque l'esame può non essere facile. Viceversa se la varianza ha un valore basso, i voti ottenuti sono pressoché equivalenti, dunque il livello di preparazione degli alunni è stato pressoché equivalente. la deviazione standard che è la radice della varianza dà esattamente la stessa indicazione di quest'ultima.
[modifica] Varianza Campionaria
La varianza campionaria è uno stimatore, corretto e coerente, della varianza reale. Può essere calcolata con la formula