Chiarire Confusione tra correlazione e causalità 

Ecco un bocconcino storico di cui potresti non essere a conoscenza. Tra gli anni 1860 e 1940, man mano che aumentava il numero di ministri metodisti residenti nel New England, anche la quantità di rum cubano importato a Boston - ed entrambi aumentarono in modo estremamente simile. Quindi, i ministri metodisti devono aver comprato un sacco di rum in quel periodo di tempo!

In realtà no, è una sciocca conclusione da disegnare. Ciò che sta realmente accadendo è che entrambe le quantità - i ministri metodisti e il rum cubano - sono state spinte verso l'alto da altri fattori, come la crescita della popolazione.

Nel raggiungere tale conclusione errata, abbiamo commesso l'errore troppo comune di la correlazione confusa con la causalità.

Qual è la differenza?

Si dice che due quantità siano correlato  se entrambi aumentano e diminuiscono insieme ("positivamente correlati"), o se uno aumenta quando l'altro diminuisce e viceversa ("negativamente correlato").

La correlazione è prontamente rilevato tramite misurazioni statistiche della Il coefficiente di correlazione di Pearson, che indica quanto siano strettamente racchiuse le due grandezze, da -1 (perfettamente correlato negativamente) attraverso 0 (non affatto correlato) e fino a 1 (perfettamente correlato positivamente).


innerself iscriviti alla grafica


 causation1tylervigen.com

Ma solo perché due quantità sono correlate non significa necessariamente che uno è direttamente causando l'altro da cambiare. La correlazione non implica causalità, proprio come il tempo nuvoloso non implica precipitazioni, anche se è vero il contrario.

Se due quantità sono correlate, potrebbe esserci una vera relazione causa-effetto (come i livelli di pioggia e le vendite di ombrelli), ma forse altre variabili stanno guidando entrambe (come numeri dei pirati e riscaldamento globale), o forse è solo una coincidenza (come Consumo di formaggio negli Stati Uniti e strangolamento per lenzuolo).

Anche dove è presente causa, dobbiamo stare attenti a non confondere la causa con l'effetto, oppure si potrebbe concludere, per esempio, che un maggiore uso di riscaldatori provoca temperature più rigide.

Al fine di stabilire la causa-effetto, abbiamo bisogno di andare al di là delle statistiche e cercare le prove separata (di carattere scientifico o storico) e il ragionamento logico. Correlazione noi può avvertire di andare alla ricerca di tali elementi di prova, in primo luogo, ma non è affatto una prova a se stante.

Problemi sottili

Anche se gli esempi di cui sopra erano ovviamente sciocco, la correlazione è molto spesso scambiato per causalità in modi che non sono immediatamente evidenti nel mondo reale. Durante la lettura e interpretazione delle statistiche, bisogna fare molta attenzione per capire esattamente ciò che i dati e le sue statistiche sono che implica - e ancora più importante, quello che sono non che implica.

 causation2

Un recente esempio della necessità di cautela nei dati interpretazione è l'emozione all'inizio di quest'anno che circonda l'innovativo apparente rilevamento di onde gravitazionali - un annuncio che sembra essere stato fatto prematuramenteprima che tutte le variabili che influivano sui dati fossero prese in considerazione.

Sfortunatamente, analizzare statistiche, probabilità e rischi non è un set di abilità cablato nel nostro intuizione umanae così è fin troppo facile essere portato fuori strada. Interi libri sono stati scritti sui modi sottili in cui le statistiche possono essere interpretate erroneamente (o utilizzate per trarre in inganno). Per aiutare a tenere alta la guardia, ecco alcuni problemi statistici sdrucciolevoli comuni di cui dovresti essere a conoscenza:

1) L'effetto Healthy Worker, dove a volte due gruppi non possono essere confrontati direttamente su una parità di condizioni.

Prendi in considerazione uno studio ipotetico che paragona la salute di un gruppo di impiegati con la salute di un gruppo di astronauti. Se lo studio non mostra alcuna differenza significativa tra i due - nessuna correlazione tra salubrità e ambiente di lavoro - dobbiamo concludere che vivere e lavorare nello spazio non comporta rischi per la salute a lungo termine per gli astronauti?

No! I gruppi non sono sullo stesso piano: i corpi degli astronauti cercano candidati sani, che mantengono un regime completo di fitness per combattere in modo proattivo gli effetti del vivere in "microgravità".

Ci aspetteremmo quindi che siano in media più salutari degli impiegati, in media, e dovrebbero essere giustamente preoccupati se non lo fossero.

2) Categorizzazione e Effetto di migrazione degli stadi: mescolare le persone tra i gruppi può avere effetti drammatici sui risultati statistici.

Questo è anche conosciuto come il Will Rogers effetto, dopo il comico statunitense che, a quanto riferito, ha scherzato:

Quando gli Okies lasciarono l'Oklahoma e si trasferirono in California, alzarono il livello medio di intelligenza in entrambi gli stati.

Per illustrare, immagina di dividere un grande gruppo di amici in un gruppo "corto" e un gruppo "alto" (forse per organizzarli per una foto). Fatto ciò, è sorprendentemente facile aumentare l'altezza media di entrambi i gruppi contemporaneamente.

Basta chiedere alla persona più corta del gruppo "alto" di passare al gruppo "corto". Il gruppo "alto" perde il membro più corto, aumentando così la sua altezza media, ma il gruppo "corto" guadagna ancora il suo membro più alto e quindi guadagna anche l'altezza media.

Ciò ha importanti implicazioni negli studi medici, in cui i pazienti vengono spesso ordinati in gruppi "sani" o "malsani" nel corso del test di un nuovo trattamento. Se i metodi diagnostici migliorano, alcuni pazienti molto leggermente malsani possono essere ricategorizzati - portando a risultati di salute di entrambi i gruppi che migliorano, indipendentemente dall'efficacia (o meno) del trattamento.

 causation3Scegliere e scegliere tra i dati può portare a conclusioni sbagliate. Gli scettici vedono il periodo di raffreddamento (blu) quando i dati mostrano realmente il riscaldamento a lungo termine (verde). skepticalscience.com 

3) Data mining: quando è presente un'abbondanza di dati, è possibile selezionare i bit e i frammenti per supportare qualsiasi conclusione desiderata.

Questa è una cattiva pratica statistica, ma se fatto deliberatamente può essere difficile da individuare senza la conoscenza dell'originale, set di dati completo.

Si consideri il grafico precedente che mostra due interpretazioni dei dati sul riscaldamento globale, ad esempio. O fluoruro: in piccole quantità è uno dei farmaci preventivi più efficaci della storia, ma l'effetto positivo scompare del tutto se si considerano solo quantità tossiche di fluoruro.

Per ragioni analoghe, è importante che le procedure per un dato esperimento statistico siano fissate prima dell'inizio dell'esperimento e rimangano invariate fino alla fine dell'esperimento.

4) Clustering - che è prevedibile anche in dati completamente casuali.

Considera uno studio medico che esamina come si presenta una particolare malattia, come il cancro o la sclerosi multipla geograficamente distribuito. Se la malattia colpisce a caso (e l'ambiente non ha alcun effetto) ci si aspetterebbe di vedere numerosi gruppi di pazienti come una cosa ovvia. Se i pazienti sono distribuiti perfettamente in modo uniforme, la distribuzione sarebbe davvero casuale!

Quindi la presenza di un singolo ammasso, o un numero di piccoli gruppi di casi, è del tutto normale. Sono necessari metodi statistici sofisticati per determinare quanto cluster è richiesto per dedurre che qualcosa in quell'area potrebbe causare la malattia.

Sfortunatamente, qualsiasi cluster, anche se non significativo, costituisce un titolo facile (ea prima vista, avvincente).

 causation4

L'analisi statistica, come qualsiasi altro strumento potente, deve essere usata con molta attenzione - e in particolare, si deve sempre essere cauti nel trarre conclusioni basate sul fatto che due quantità sono correlate.

Invece, dobbiamo sempre insistere su prove separate per discutere di causa-effetto - e tale evidenza non arriverà sotto forma di un singolo numero statistico.

Correlazioni apparentemente avvincenti, diciamo tra geni dati e schizofrenia o tra a dieta ricca di grassi e le malattie cardiache, potrebbero rivelarsi basate su una metodologia molto dubbia.

Siamo forse come una specie malata cognitivamente pronta a trattare questi problemi. Come educatore canadese Kieran Egan mettilo nel suo libro Ottenendolo sbagliato dall'inizio:

La cattiva notizia è che la nostra evoluzione ci ha equipaggiati per vivere in società piccole, stabili, di cacciatori-raccoglitori. Siamo persone del Pleistocene, ma i nostri cervelli languinati hanno creato società massicce, multiculturali, tecnologicamente sofisticate e in rapida evoluzione per permetterci di vivere.

Di conseguenza, dobbiamo costantemente resistere alla tentazione di vedere il significato nel caso e di confondere correlazione e causalità.The Conversation

Questo articolo è stato pubblicato in origine The Conversation
Leggi l' articolo originale.


Informazioni sugli autori

borwein jonathanJonathan Borwein (Jon) è Laureate Professor of Mathematics presso l'Università di Newcastle. È professore laureato di matematica presso l'Università di Newcastle e direttore del Centro per la ricerca matematica assistita e le sue applicazioni (CARMA). Ha lavorato presso Carnegie-Melon, Dalhousie, Simon Fraser e Waterloo University e ha tenuto due Chairs di ricerca in Canada nel settore dell'informatica.

rosa michaelMichael Rose è un candidato al Dottorato di Ricerca, Scuola di Scienze Matematiche e Fisiche all'Università di Newcastle. Studente di Dottorato in Matematica sotto la supervisione del Laureato Prof. Jon Borwein presso l'Università di Newcastle, in Australia. Attualmente si assiste alla ricerca sull'applicazione della matematica frattale alla modellazione delle distribuzioni di sinapsi cerebrali.

Disclosure Statement: Gli autori non lavorano per, consultare, possedere azioni o ricevere finanziamenti da qualsiasi società o organizzazione che trarrebbe beneficio da questo articolo. Inoltre non hanno affiliazioni rilevanti.


Libro consigliato:

Il denaro, sesso, guerra, Karma: Appunti per una rivoluzione buddista
di David R. Loy.

Il denaro, sesso, guerra, Karma: Appunti per una rivoluzione buddista da David R. Loy.David Loy è diventato uno dei più potenti sostenitori della visione del mondo buddista, spiegando come nessun altro la sua capacità di trasformare il panorama sociopolitico del mondo moderno. Nel Soldi, sesso, guerra, karma, offre presentazioni nitide e persino incredibilmente chiare di graffette buddiste spesso fraintese - il funzionamento del karma, la natura del sé, le cause dei problemi sia a livello individuale che sociale - e le vere ragioni dietro il nostro senso collettivo di "mai abbastanza "se è tempo, denaro, sesso, sicurezza ... anche la guerra. La "rivoluzione buddista" di David non è altro che un cambiamento radicale nei modi in cui possiamo avvicinarci alle nostre vite, al nostro pianeta, alle delusioni collettive che pervadono la nostra lingua, cultura e persino la nostra spiritualità.

Clicca qui per maggiori informazioni e / o per ordinare questo libro su Amazon.