Come evitare i sette peccati capitali dell'errata interpretazione statistica

Le statistiche sono uno strumento utile per comprendere i modelli del mondo che ci circonda. Ma la nostra intuizione spesso ci delude quando si tratta di interpretare quei modelli. In questa serie esaminiamo alcuni degli errori più comuni che facciamo e come evitarli quando pensiamo a statistiche, probabilità e rischi.The Conversation

1. Supponendo che le piccole differenze siano significative

Molte delle fluttuazioni giornaliere nel mercato azionario rappresentano la possibilità piuttosto che qualcosa di significativo. Le differenze nei sondaggi quando una parte è avanti di un punto o due sono spesso solo rumore statistico.

È possibile evitare di trarre conclusioni errate sulle cause di tali fluttuazioni chiedendo di vedere il "margine di errore" relativo ai numeri.

Se la differenza è inferiore al margine di errore, è probabile che non vi siano differenze significative e la variazione è probabilmente dovuta a fluttuazioni casuali.

Come evitare i sette peccati capitali dell'errata interpretazione statisticaLe barre di errore illustrano il grado di incertezza in un punteggio. Quando tali margini di errore si sovrappongono, è probabile che la differenza sia dovuta a rumore statistico.


innerself iscriviti alla grafica



2. Equivalente significato statistico con significato del mondo reale

Sentiamo spesso delle generalizzazioni su come due gruppi differiscono in qualche modo, come ad esempio che le donne sono più nutrite mentre gli uomini sono fisicamente più forti.

Queste differenze spesso si basano su stereotipi e saggezza popolare, ma spesso ignorano le somiglianze nelle persone tra i due gruppi e la variazione nelle persone all'interno dei gruppi.

Se scegli due uomini a caso, è probabile che ci sia molta differenza nella loro forza fisica. E se scegli un uomo e una donna, potrebbero finire per essere molto simili in termini di nutrimento, o l'uomo potrebbe essere più nutrente della donna.

È possibile evitare questo errore chiedendo la "dimensione dell'effetto" delle differenze tra i gruppi. Questa è una misura di quanto la media di un gruppo differisce dalla media di un altro.

Se la dimensione dell'effetto è piccola, i due gruppi sono molto simili. Anche se la dimensione dell'effetto è grande, i due gruppi probabilmente avranno ancora una grande quantità di variazioni all'interno di essi, quindi non tutti i membri di un gruppo saranno diversi da tutti i membri di un altro gruppo.


3. Trascurando di guardare gli estremi

Il rovescio della dimensione dell'effetto è rilevante quando la cosa su cui ti stai concentrando segue un "distribuzione normale"(A volte chiamato" curva a campana "). Questo è dove la maggior parte delle persone è vicino al punteggio medio e solo un piccolo gruppo è ben al di sopra o al di sotto della media.

Quando ciò accade, un piccolo cambiamento nelle prestazioni per il gruppo produce una differenza che non significa nulla per la persona media (vedi punto 2) ma che cambia radicalmente il carattere degli estremi.

Evita questo errore riflettendo se hai a che fare con degli estremi o no. Quando hai a che fare con persone normali, le differenze in piccoli gruppi spesso non contano. Quando ti preoccupi molto degli estremi, le piccole differenze di gruppo possono essere importanti.

Come evitare i sette peccati capitali dell'errata interpretazione statisticaQuando due popolazioni seguono una distribuzione normale, le differenze tra di esse saranno più evidenti agli estremi rispetto alle medie.


4. Fidarsi della coincidenza

Sapevi che c'è un? correlazione tra il numero di persone annegate ogni anno negli Stati Uniti cadendo in una piscina e il numero di film in cui è apparso Nicholas Cage?

Come evitare i sette peccati capitali dell'errata interpretazione statisticaMa esiste un nesso causale? tylervigen.com

Se guardi bene puoi trovare schemi e correlazioni interessanti che sono semplicemente dovuti alla coincidenza.

Solo perché due cose cambiano nello stesso momento, o in modelli simili, non significa che siano correlate.

Evita questo errore chiedendo quanto sia affidabile l'associazione osservata. È una tantum o è successo più volte? Le future associazioni possono essere previste? Se l'hai visto solo una volta, è probabile che sia dovuto a casualità.


5. Ottenere la causalità all'indietro

Quando due cose sono correlate - per esempio, problemi di disoccupazione e di salute mentale - potrebbe essere allettante vedere un percorso causale "ovvio" - dire che i problemi di salute mentale portano alla disoccupazione.

Ma a volte il percorso causale va nella direzione opposta, come la disoccupazione che causa problemi di salute mentale.

Puoi evitare questo errore ricordando di pensare alla causalità inversa quando vedi un'associazione. L'influenza potrebbe andare nella direzione opposta? O potrebbe andare in entrambe le direzioni, creando un ciclo di feedback?


6. Dimenticando di considerare cause esterne

Le persone spesso non riescono a valutare possibili "terzi fattori", o cause esterne, che possono creare un'associazione tra due cose perché entrambi sono in realtà risultati del terzo fattore.

Ad esempio, potrebbe esserci un'associazione tra mangiare in ristoranti e migliorare la salute cardiovascolare. Ciò potrebbe farti credere che esiste una connessione causale tra i due.

Tuttavia, potrebbe rivelarsi che coloro che possono permettersi di mangiare nei ristoranti regolarmente sono in una fascia alta socioeconomica, e possono anche permettersi una migliore assistenza sanitaria, ed è l'assistenza sanitaria che offre una migliore salute cardiovascolare.

Puoi evitare questo errore ricordando di pensare a terzi fattori quando vedi una correlazione. Se stai seguendo una cosa come una possibile causa, chiediti cosa, a sua volta, causa quella cosa? Questo terzo fattore potrebbe causare entrambi gli esiti osservati?


7. Grafici ingannevoli

Si verificano molti errori nella scalatura e nell'etichettatura dell'asse verticale sui grafici. Le etichette dovrebbero mostrare tutta la gamma significativa di ciò che stai guardando.

Ma a volte il grafico crea un intervallo più ristretto per fare in modo che una piccola differenza o un'associazione sembrino più impattanti. Su una scala da 0 a 100, due colonne potrebbero avere la stessa altezza. Ma se grafici gli stessi dati che mostrano solo da 52.5 a 56.5, potrebbero sembrare drasticamente diversi.

È possibile evitare questo errore prestando attenzione a notare le etichette del grafico lungo gli assi. Sii particolarmente scettico nei confronti dei grafici non etichettati.

Come evitare i sette peccati capitali dell'errata interpretazione statisticaI grafici possono raccontare una storia - facendo apparire le differenze più grandi o più piccole a seconda della scala.

Circa l'autore

Winnifred Louis, professore associato, psicologia sociale, L'Università del Queensland e Cassandra Chapman, PhD Candidate in Social Psychology, L'Università del Queensland

Questo articolo è stato pubblicato in origine The Conversation. Leggi il articolo originale.

Libri correlati:

at InnerSelf Market e Amazon