Deviazione standard e varianza sono probabilmente gli indici di variabilità statistici più conosciuti. Ma quando si possono utilizzare? Come si calcolano? Come si interpretano? Scoprilo in questo articolo.
Indice
Introduzione
Per descrivere correttamente una variabile, non è sufficiente utilizzare una media statistica come la media aritmetica o la mediana. Questi indici, seppur molto importanti per sintetizzare i dati, forniscono infatti una visione solo parziale della della variabile che stai analizzando. Serve anche utilizzare un indice di variabilità, come la deviazione standard.
L’indice di posizione ti permette di farti un’idea di cosa avviene nella parte centrale della distribuzione, ma non ti permette di capire cosa avviene nelle altre parti della distribuzione e, in assenza di variabilità, fare un’analisi statistica su una variabile non avrebbe senso: una singola osservazione sarebbe sufficiente per conoscere tutto ciò che riguarda quella variabile.
Per questo, agli indici di posizione è sempre importante abbinare anche un indice di variabilità, come la deviazione standard oppure il range interquartile.
Ad esempio, una delle combinazioni più frequentemente utilizzate per descrivere una variabile quantitativa è la media associata con la deviazione standard. La media infatti serve per misurare il baricentro della distribuzione ma da sola non è sufficiente per descrivere adeguatamente la distribuzione di una variabile quantitativa. Non ti dice nulla, infatti, sulla variabilità dei dati.
Per sopperire a questa mancanza, c’è la deviazione standard che si utilizza proprio per misurare quanto sono lontane le unità statistiche dalla media. In pratica, la deviazione standard sintetizza le deviazioni dalla media.
In questo articolo scoprirai quando utilizzare la deviazione standard, il suo significato, come calcolarla ed interpretarla. Inoltre, ti aiuterà a capire finalmente che differenza c’è tra deviazione standard e varianza e quando questi indici possono essere ingannevoli.
Che cos’è la deviazione standard?
La deviazione standard di una variabile è un indice riassuntivo delle differenze dei valori di ogni osservazione rispetto alla media della variabile.
Ogni osservazione ha infatti uno scostamento (detto anche scarto o deviazione) dalla media. Questo scostamento è pari a 0 se l’osservazione ha esattamente lo stesso valore della media. Lo scostamento sarà invece negativo se l’osservazione ha un valore più piccolo di quello della media. Al contrario, questo scostamento sarà positivo se l’osservazione ha un valore più grande di quello della media.
Tuttavia, la somma di tutti questi scostamenti non può essere utilizzata come misura di variabilità. Se si sommassero tutte le differenze, gli scostamenti negativi si compenserebbero esattamente con gli scostamenti positivi e la loro somma sarebbe pari a zero. Per definizione, infatti, la media corrisponde sempre al baricentro di una distribuzione.
Devianza: definizione
Per questo motivo per calcolare la deviazione standard si usano i quadrati degli scostamenti. Elevando al quadrato uno scostamento si ottiene infatti un numero positivo sia che lo scostamento sia positivo sia che sia negativo. Il quadrato permette infatti di sommare gli scarti negativi a quelli positivi senza che i segni influenzino il risultato rendendolo nullo. La somma di tutti gli scarti della media al quadrato prende il nome di devianza.
Varianza: definizione
La media delle deviazioni quadratiche prende il nome di varianza. Per come è costruita, la varianza è espressa nel quadrato dell’unità di misura utilizzata per la variabile.
Per esempio, se l’unità di misura della variabile è l’Euro, la varianza risulterà espressa in Euro al quadrato, una quantità di fatto non molto interpretabile dal punto di vista pratico.
Deviazione standard: definizione
Proprio perché interpretare il valore di un’unità di misura al quadrato non è semplice, si preferisce utilizzare la radice quadrata che ha la stessa unità di misura della variabile e della media. La radice quadrata con segno positivo della varianza è detta deviazione standard o scarto quadratico medio. In altre parole, varianza e deviazione standard sono entrambe misure di dispersione legate tra loro dal fatto che la varianza è pari al quadrato della deviazione standard.
Simbolo varianza e deviazione standard
Con la lettera s in statistica si indica la deviazione standard del campione. Il suo quadrato indica invece la varianza del campione.
Con la lettera greca sigma ci si riferisce invece alla popolazione: sigma indica la deviazione standard della popolazione e sigma quadro indica la varianza della popolazione.
Deviazione standard: significato
Il termine standard si riferisce al fatto che la deviazione calcolata rappresenta una distanza media, ovvero una distanza “tipica” di ogni singola osservazione dalla media.
Più c’è variabilità tra le osservazioni, più grandi sono gli scostamenti dalla media, maggiore è la somma dei quadrati e, quindi, più elevato è il valore dalla varianza e di conseguenza anche dallo scarto quadratico medio.
Per capirci meglio, nella tabella qui sotto ho riportato come esempio i valori relativi alla variabile quantitativa “numero di figli” per 3 diversi campioni (A, B e C), ognuno costituito da 7 individui.
Come puoi osservare dalla penultima riga della tabella, tutti e tre i campioni hanno la stessa media. Quello che varia è il valore dello scarto quadratico medio.
Deviazione standard nulla
Il valore minimo che può assumere la deviazione standard è zero. Come puoi vedere dalla tabella questa situazione si verifica per il campione A in cui tutti gli individui hanno lo stesso identico numero di figli. In particolare, in questo esempio nel campione A sono stati inclusi solo individui che hanno due figli e quindi non c’è alcuna variabilità tra i dati. In questo caso, più che di variabile sarebbe più opportuno parlare del “n. di figli” come di una costante.
Deviazione standard piccola
Nel campione B c’è una bassa variabilità: i valori non sono tutti uguali tra di loro, ma la deviazione standard è piccola rispetto al valore della media. I dati sono quindi poco sparsi intorno alla media: c’è chi ha 2 figli, chi ne ha 1 e chi ne ha 3 ma questi sono tutti valori vicini a quello della media (in questo caso pari a 2 figli).
Quando la deviazione standard è alta?
Il campione C è invece caratterizzato da una maggiore variabilità dei dati: c’è chi non ha nessun figlio e chi ne ha addirittura cinque. Questa ampia variabilità si riscontra anche nel valore della deviazione standard che risulta essere alta, ovvero maggiore rispetto a quella calcolata sul campione B.
Deviazione standard: quando si può utilizzare?
Lo scarto quadratico medio misura la dispersione rispetto alla media e dovrebbe essere usata soltanto quando la media è scelta come indice di posizione. E proprio come la media, si può utilizzare solo per variabili quantitative.
Ci sono poi delle situazioni in cui la media, e di conseguenza la deviazione standard, non è l’indice di posizione più indicato anche se la variabile è quantitativa. Questi due indici si calcolano considerando tutte le osservazioni che fanno parte del campione. Una forte asimmetria o la presenza di outliers possono far aumentare di molto il valore dello scarto quadratico medio e di conseguenza falsare i risultati dell’analisi. In queste situazioni potrebbe anche capitare che il valore della deviazione standard sia maggiore di quello della media. Non è un errore, ma semplicemente un’indicazione che le unità statistiche hanno valori molto diversi tra loro.
In questi casi, è preferibile utilizzare come media statistica la mediana. E utilizzare la deviazione standard in combinazione con la mediana non è una buona soluzione ed è preferibile ricorrere al calcolo del range interquartile come misura di variabilità.
In ogni caso, ricordati che gli indici numerici non rilevano la presenza di dati concentrati in un unico punto o di intervalli vuoti e possono pertanto essere ingannevoli. Due campioni possono avere per una variabile la stessa media e lo stesso scarto quadratico medio ma distribuzioni molto differenti tra loro. Per questo motivo ti consiglio sempre di rappresentare i dati anche graficamente. Nel caso di variabili quantitative, puoi utilizzare ad esempio l’istogramma oppure il boxplot.
Come si calcola la deviazione standard campionaria?
Lo scarto quadratico medio di un campione può essere calcolato molto velocemente utilizzando un qualsiasi software statistico, come SPSS o R, oppure con un foglio elettronico o anche con una semplice calcolatrice.
Calcolo scarto quadratico medio e varianza su Excel
Per effettuare i calcoli su Excel o Fogli Google non ti servirà neanche ricordare formule perché la deviazione standard e la varianza sono due funzioni già preimpostate: =DEV.ST() e =VAR()
Calcolo deviazione standard con la calcolatrice
Se devi invece fare il calcolo a mano, dovrai prima calcolare la varianza e poi fare la radice quadrata del numero ottenuto per ricavare il valore dello scarto quadratico medio.
Calcolo varianza campionaria
La varianza di un insieme di unità statistiche si ottiene in 3 passaggi:
- Prima si calcola la media della variabile.
- Poi si determina la devianza: si calcola la differenza di ogni osservazione dalla media e poi se ne calcola il quadrato. Infine si fa la somma di tutti le differenze al quadrato.
- Infine si divide per i gradi di libertà, che coincidono con la numerosità del campione meno uno, vale a dire n-1 invece che n. Quando si hanno i dati riferiti ad un’intera popolazione, invece che solo ad un campione, si sostituisce (n-1) con l’effettiva numerosità della popolazione (N).
Formula deviazione standard campionaria
La deviazione standard è la radice quadrata con segno positivo della varianza. La formula pertanto è:
Questa formula è composta da:
- una differenza al quadrato, ovvero gli scarti al quadrato di ogni singola osservazione dalla media
- una sommatoria, perché gli scarti al quadrato vanno tra loro sommati
- una divisione per n-1, perché la somma degli scarti al quadrato è divisa per il numero di osservazioni del campione meno 1. Ricordati che il “-1” è una caratteristica propria della deviazione standard campionaria e non è presente nella formula riferita alla popolazione.
- una radice quadrata, perché la deviazione standard è la radice quadrata con segno positivo della varianza campionaria, che è esattamente quello che hai calcolato sotto radice.
Come si interpreta la deviazione standard?
La deviazione standard è pari a 0 solo quando non c’è dispersione. Questa situazione si verifica solo quando tutte le unità statistiche hanno lo stesso valore. In tutti gli altri casi, è sempre maggiore di 0. Quanto più i valori sono lontani dalla media, tanto più la deviazione standard sarà grande.
Quando n=1 la deviazione standard è indefinita perché con una sola osservazione non ha senso calcolare la variabilità che prevede la presenza di almeno 2 osservazioni.
Deviazione standard: esercizio pratico
Ipotizziamo che ad un esame di inglese si sono presentati 100 studenti che hanno conseguito un punteggio medio di 26/30. Quale valore fra 0, 2 e 12 è più plausibile per la deviazione standard?
Soluzione esercizio sullo scarto quadratico medio
Uno scarto quadratico medio pari a zero è abbastanza inverosimile. Significherebbe infatti che tutti e 100 gli studenti hanno ottenuto il punteggio di 26 all’esame.
Anche una deviazione standard pari a 12 è inverosimile perché una distanza tipica di 26+12 è implausibilmente elevato. Per esempio, non si può conseguire un punteggio di 38 ad un esame il cui voto è espresso in trentesimi.
Ci si può invece aspettare di trovare una una deviazione standard pari a 2. In questo caso infatti la distanza tipica prevede che siano plausibili votazioni di 24 e di 28 che effettivamente sono possibili.
Proprietà della deviazione standard
Quando la distribuzione ha una forma a campana, lo scarto quadratico medio ha un’interpretazione più precisa:
- Il 68% circa delle osservazioni cade entro 1 ds dalla media.
- Il 95% circa delle osservazioni cade entro 2 ds dalla media.
- Il 99% circa delle osservazioni cade entro 3 ds dalla media.
Ricordati che questa regola empirica vale però solo per le distribuzioni con un solo picco (unimodali) e approssimativamente simmetriche con forma a campana. Quando la distribuzione è molto asimmetrica, l’osservazione più estrema in una delle due direzioni potrebbe non essere poi così lontana dalla media.
Nell’esempio precedente dell’esame universitario di inglese, il voto massimo (30) cade solamente entro 2 volte la deviazione standard dalla media (cioè 30=26+2*2). Al contrario, il voto minimo (18) cade a più di 3 deviazioni standard dalla media (cioè 18 è inferiore a 26-3*2=20). Questo accade perché la distribuzione dei voti dell’esame è fortemente asimmetrica a sinistra.
Non puoi quindi utilizzare questa interpretazione di ciò che lo scarto quadratico medio misura. In generale, la deviazione standard misura la distanza tipica delle osservazioni dalla media. E questa definizione vale per tutte le distribuzioni.
Nel caso invece di un caso particolare di distribuzioni con forma a campana, le distribuzioni normali, la regola empirica permette non solo di individuare quanta percentuale di osservazioni si trova ad 1, 2 o 3 deviazioni standard dalla media ma anche di poter calcolare la probabilità di distribuzione ad ogni distanza, semplicemente conoscendo la media e lo scarto quadratico medio della variabile.
E adesso?
Se vuoi scoprire cosa significano e quando si usano tanti altri termini statistici scarica subito questa guida gratuita di statistica.
FAQs
Deviazione standard: definizione e significato - Paola Pozzolo? ›
La deviazione standard di una variabile è un indice riassuntivo delle differenze dei valori di ogni osservazione rispetto alla media della variabile. Ogni osservazione ha infatti uno scostamento (detto anche scarto o deviazione) dalla media.
Qual è la differenza tra varianza e deviazione standard? ›La Varianza é un indice di ampiezza che identifica la dispersione di una Variabile Aleatoria, normalizza inoltre la distribuzione rispetto al Valor Medio. La Deviazione Standard é definita come la radice quadrata della Varianza, é chiamata anche scarto quadratico medio.
Come si calcola la deviazione standard esempio? ›- calcolare la media delle misure a disposizione: (3+5+7+8+10)/5 = 6.6.
- elevare il risultato della media al quadrato: 43.56.
- elevare tutte le misure a disposizione al quadrato: 9, 25, 49, 64, 100.
Deviazione standard: quando si può utilizzare? Lo scarto quadratico medio misura la dispersione rispetto alla media e dovrebbe essere usata soltanto quando la media è scelta come indice di posizione. E proprio come la media, si può utilizzare solo per variabili quantitative.
A cosa serve la deviazione standard di un'azione? ›Si tratta di uno scarto utilizzato per indicare la variabilità di un'attività finanziaria e dei suoi rendimenti. In pratica, questa funzione grafica rappresenta una misura della volatilità dell'attività, e quindi implicitamente anche del suo grado di rischiosità.
Cosa si intende per deviazione standard? ›La deviazione standard di una variabile è un indice riassuntivo delle differenze dei valori di ogni osservazione rispetto alla media della variabile. Ogni osservazione ha infatti uno scostamento (detto anche scarto o deviazione) dalla media.
Cosa ci dice la deviazione standard? ›La deviazione standard, espressa come radice quadrata della varianza e misura la dispersione dei rendimenti rispetto alla media dei rendimenti stessi. In altre parole la deviazione standard è una misura di volatilità.
A cosa serve la devianza? ›La devianza costituisce un indice di dispersione dei dati, il quale determina la somma dei quadrati degli scarti della media di una variabile rappresentante una distribuzione di dati. In termini più semplici, essa fornisce un grado di dispersione di una certa variabile dal proprio valore mediano.
Come si interpreta la varianza? ›La varianza è uguale a zero quando tutti i valori della variabile sono uguali e quindi non c'è variabilità nella distribuzione; in ogni caso è positiva e misura il grado di variabilità di una distribuzione. Tanto maggiore è la varianza tanto più i valori sono dispersi.
Quando la deviazione standard è bassa? ›Più la deviazione è bassa, minore sarà il rischio di avere forti variazioni di rendimento rispetto alla media. Quindi: A parità di rendimento, conviene scegliere il titolo/portafoglio con deviazione minore; A parità di deviazione, puoi scegliere il titolo/portafoglio con rendimento maggiore.
Come si chiama la deviazione standard su Excel? ›
La funzione DEV. ST. VALORI presuppone che i relativi argomenti rappresentino un campione della popolazione. Se i dati in questione rappresentano l'intera popolazione, per calcolare la deviazione standard utilizzare la funzione DEV.
Quando la deviazione standard e elevata? ›Una deviazione standard elevata indica che i valori sono diffusi su un intervallo più ampio. Quando vengono divulgati i risultati di uno studio clinico, normalmente viene inclusa la deviazione standard poiché questa fornisce una guida (abbozzata) alla significatività statistica.
Cosa indica la deviazione standard di un rendimento di mercato? ›La deviazione standard è una misura statistica di dispersione attorno alla media che indica quanto è stata ampia, in un certo arco temporale, la variazione dei rendimenti di un fondo.
Come si calcola la devianza? ›In statistica, la d. di una serie numerica è la somma dei quadrati delle differenze tra i valori della serie e la loro media; divisa per il numero dei valori considerati dà la varianza. La d. viene soprattutto utilizzata nell'analisi della varianza.
A cosa serve il coefficiente di variazione? ›Il coefficiente di variazione, indicato con CV, è una misura relativa espressa in percentuale e non nell'unità di misura dei dati. Il suo obiettivo è di calcolare la dispersione di una variabile combinando media e deviazione standard eliminando dal risultato il “peso” dell'unità di misura.
Cosa significa deviazione standard 15? ›Si tratta di un quoziente di deviazione standard: esprime, cioè, la differenza di punteggio (in eccesso o in difetto) di un soggetto rispetto al punteggio medio del suo gruppo d'età. La media viene considerata uguale a 100, la deviazione standard è 15.
Come calcolare la deviazione standard di un titolo? ›- Calcolare la media delle rendimenti (μ)
- Ottenere la deviazione di ogni rendimento dalla media (ri – μ)
- Elevare al quadrato le deviazioni in modo da ottenere tutti valori positivi (ri – μ) ...
- Sommare le tutte le deviazioni elevate al quadrato ∑(ri – μ)
Tradizionalmente sono o sono state considerate forme di devianza la criminalità, la delinquenza giovanile, la violenza, il suicidio, l'abuso di droghe, l'alcolismo, l'omosessualità, la malattia mentale.
Quali sono le caratteristiche della devianza? ›Ritualismo, atteggiamento di chi non crede nei valori e nelle mete proposte dalla società ma accetta i propri mezzi. Rinuncia (atteggiamento passivo), rifiuto sia dei mezzi che delle mete, ad esempio disadattati o tossicodipendenti. Ribellione (atteggiamento attivo), rifiuto dei mezzi e delle mete riproponendone nuovi.
Quali sono le cause devianza? ›I fenomeni di devianza compiuti dalle persone, si pensa siano causati da conflitti irrisolti e da meccanismi riscontratisi nell'infanzia e nell'adolescenza. Le cause, quindi, sarebbero debolezza di carattere e degenerazione morale.
Cos'è la varianza in parole semplici? ›
La varianza è una misura statistica che indica la distanza di un insieme di numeri dal loro valore medio, ovvero quanto i valori di quell'insieme si discostano dalla media. Viene perciò detta “misura di dispersione” o “variabile aleatoria”.
Quando la varianza è uguale a zero? ›La varianza è uguale a zero quando tutti i valori della variabile sono uguali e quindi non c'è variabilità nella distribuzione; in ogni caso è positiva e misura il grado di variabilità di una distribuzione.
A cosa serve l'analisi della varianza? ›Analisi della varianza (ANOVA) è una formula statistica usata per confrontare le varianze tra le medie (o la media) di gruppi diversi. Un range di scenari la utilizza per stabilire se c'è qualche differenza tra le medie di gruppi diversi.
Come si minimizza il rischio specifico? ›Se il titolo fa parte di un portafoglio, il rischio specifico può essere ridotto (fino ad essere annullato) attraverso una adeguata diversificazione, dal momento che i prezzi dei diversi titoli non presentano un andamento concorde e, quindi, rendimenti negativi possono essere compensati da rendimenti positivi.
Cosa rappresenta l'indice di Sharpe? ›L'Indice di Sharpe misura il rapporto tra il maggior rendimento di un fondo rispetto al rendimento di un prodotto finanziario senza rischio e la sua volatilità.
Qual è il finanza L'esempio più semplice di misura statistica del rischio? ›La più utilizzata misura di rischio è la variabilità dei rendimenti rispetto alla media, quantificata dalla varianza e dalla deviazione standard: Dove: = Rendimento del periodo i. = Rendimento medio.
Cosa si intende per devianza statistica? ›In statistica la devianza, o somma dei quadrati degli scarti dalla media, è un indice di dispersione dei dati. È anche chiamata somma dei quadrati, dall'inglese sum of squares. La sua espressione (se si fa riferimento ad una popolazione) è data da: è la media dei dati.
Qual è lo scopo della statistica? ›STATISTICA: DI COSA SI OCCUPA - La statistica si occupa di studiare un fenomeno con lo scopo di metterne in evidenza gli aspetti essenziali, risalendo eventualmente alle leggi che lo regolano. Nella maggior parte dei casi rappresenta il mezzo più efficace per ridurre il margine di incertezza delle nostre scelte.
Come si calcola la media è la deviazione standard? ›Per calcolare la deviazione standard, inizia ottenendo la media del campione di dati. Sottrai poi la media da tutti i valori del campione ed eleva al quadrato tutte le differenze. In seguito somma tutti i quadrati e dividi il risultato per n meno 1, in cui n è pari al numero di elementi presenti nel campione.
Quando si usa la varianza? ›La varianza viene usata nella teoria delle decisioni come misura della rischiosità di una distribuzione. Se due distribuzioni hanno la stessa media e varianza diversa, la distribuzione con varianza maggiore è la più rischiosa (lo scarto è maggiore).
Cosa significa se la deviazione standard è alta? ›
Se la deviazione è molto alta, vuol dire che il titolo o il portafoglio considerato può avere una variabilità notevole dei risultati rispetto alla sua media.
Come si calcola la varianza è la devianza? ›- VARIANZA = DEVIANZA / N.
- Il problema principale è quello di avere un indicatore di variabilità che abbia la stessa unità di misura del fenomeno che stai studiando e di conseguenza della sua media aritmetica.
- DEVIAZIONE STANDARD = RADICE DELLA VARIANZA.
La scomposizione della varianza totale vuole capire se i numeri sono molto diversi tra di loro all'interno di questi gruppi oppure all'esterno, cioè tra un gruppo e l'altro.
Come spiegare la varianza? ›La varianza è anche conosciuta come deviazione standard quadratica ed è indicata con la lettera greca sigma al quadrato σ2. La varianza è la media aritmetica dei quadrati delle differenze tra ogni valore Xi della distribuzione e un valore medio preso come riferimento.
Come si chiama il simbolo della varianza? ›La varianza della popolazione si indica con il simbolo σ2, la lettera minuscola dell'alfabeto greco sigma elevato al quadrato (si legge “sigma quadro”) e lo scarto quadratico medio della popolazione si indica con il simbolo σ.
Come si calcola la deviazione standard in statistica? ›La formula per il coefficiente di variazione è: Coefficiente di variazione = (Deviazione standard / media) * 100. In simboli: CV = (SD/xbar) * 100. Moltiplicare il coefficiente per 100 è un passo facoltativo per ottenere una percentuale, invece di un decimale.
Come si calcola la deviazione standard di un portafoglio? ›- Calcolare la media delle rendimenti (μ)
- Ottenere la deviazione di ogni rendimento dalla media (ri – μ)
- Elevare al quadrato le deviazioni in modo da ottenere tutti valori positivi (ri – μ) ...
- Sommare le tutte le deviazioni elevate al quadrato ∑(ri – μ)
Ma esiste anche un'altra faccia della devianza sociale, quella positiva, la quale consiste nei comportamenti che si discostano dal comportamento considerato normale perché virtuosi. La devianza positiva può essere definita muovendo dalla distinzione tra modelli di condotta reali e modelli di condotta ideali.