In che modo Twitter offre agli scienziati una finestra sulla felicità e la salute umane

Dal suo lancio pubblico 10 anni fa, Twitter è stato utilizzato come piattaforma di social networking tra amici, un servizio di messaggistica istantanea per gli utenti di smartphone e uno strumento promozionale per aziende e politici.

Ma è stata anche una fonte inestimabile di dati per ricercatori e scienziati - come me - che vogliono studiare come gli esseri umani sentono e funzionano all'interno di complessi sistemi sociali.

Analizzando i tweet, siamo stati in grado di osservare e raccogliere dati sulle interazioni sociali di milioni di persone "allo stato selvatico", al di fuori di esperimenti di laboratorio controllati.

Ci ha permesso di sviluppare strumenti per monitorare il emozioni collettive di grandi popolazioni, trovare il posti più felici negli Stati Uniti e altro ancora.

In che modo, esattamente, Twitter è diventato una risorsa così unica per gli scienziati sociali computazionali? E cosa ci ha permesso di scoprire?


innerself iscriviti alla grafica


Il più grande dono di Twitter per i ricercatori

A luglio 15, 2006, Twittr (come era allora noto) pubblicamente lanciato come "servizio mobile che aiuta i gruppi di amici a rimbalzare pensieri casuali in giro con SMS." La possibilità di inviare testi di gruppo 140 gratuiti ha spinto molti dei primi ad adottarli (me compreso) per utilizzare la piattaforma.

Con il tempo, il numero di utenti esploso: da 20 milioni in 2009 a 200 milioni in 2012 e 310 milioni oggi. Piuttosto che comunicare direttamente con gli amici, gli utenti dovrebbero semplicemente dire ai loro follower come si sentivano, rispondere alle notizie in modo positivo o negativo, o battere le barzellette.

Per i ricercatori, il più grande regalo di Twitter è stata la fornitura di grandi quantità di dati aperti. Twitter è stato uno dei primi principali social network a fornire campioni di dati tramite qualcosa chiamato Application Programming Interfaces (API), che consente ai ricercatori di interrogare Twitter per tipi specifici di tweet (ad esempio, tweet contenenti determinate parole), nonché informazioni sugli utenti .

Ciò ha portato a un'esplosione di progetti di ricerca che sfruttano questi dati. Oggi, una ricerca di Google Scholar per "Twitter" produce sei milioni di visite, rispetto a cinque milioni per "Facebook". La differenza è particolarmente sorprendente dato che Facebook ha all'incirca cinque volte più utenti di Twitter (ed è di due anni più vecchio).

La generosa politica sui dati di Twitter ha indubbiamente portato a un'eccellente pubblicità gratuita per l'azienda, poiché interessanti studi scientifici sono stati raccolti dai media mainstream.

Studiare felicità e salute

Con i dati del censimento tradizionali lenti e costosi da raccogliere, i feed di dati aperti come Twitter hanno la possibilità di fornire una finestra in tempo reale per vedere i cambiamenti in popolazioni numerose.

L'Università del Vermont Computational Story Lab è stata fondata in 2006 e studia i problemi della matematica applicata, della sociologia e della fisica. Da quando 2008, Story Lab ha raccolto miliardi di tweet tramite il feed "Gardenhose" di Twitter, un'API che trasmette un campione casuale di 10 per cento di tutti i tweet pubblici in tempo reale.

Ho trascorso tre anni al Computational Story Lab e ho avuto la fortuna di far parte di molti studi interessanti utilizzando questi dati. Ad esempio, abbiamo sviluppato a hedonometer che misura la felicità della Twittersfera in tempo reale. Concentrandoci sui tweet geolocalizzati inviati dagli smartphone, siamo stati in grado di farlo carta geografica i posti più felici negli Stati Uniti. Forse non sorprendentemente, abbiamo trovato Le Hawaii sono lo stato più felice e la città vinicola di Napa la città più felice per 2013. 

Una mappa di 13 milioni di tweet geolocalizzati USA di 2013, colorati dalla felicità, con il rosso che indica la felicità e il blu che indica la tristezza. PLOS ONE, Autore fornitoUna mappa di 13 milioni di tweet geolocalizzati USA di 2013, colorati dalla felicità, con il rosso che indica la felicità e il blu che indica la tristezza. PLoS ONE, Autore fornito.Questi studi hanno avuto applicazioni più profonde: correlare l'utilizzo delle parole di Twitter con i dati demografici ci ha aiutato a capire i modelli socioeconomici sottostanti nelle città. Ad esempio, potremmo collegare l'utilizzo delle parole a fattori di salute come l'obesità, quindi abbiamo creato un lexicocalorimeter misurare il "contenuto calorico" dei post sui social media. I tweet di una particolare regione che menzionavano cibi ipercalorici aumentavano il "contenuto calorico" di quella regione, mentre i tweet che menzionavano attività di esercizio diminuivano la nostra metrica. Abbiamo trovato questa semplice misura correlazione con altre metriche di salute e benessere. In altre parole, i tweet sono stati in grado di darci un'istantanea, in un momento specifico, della salute generale di una città o di una regione.

Usando la ricchezza dei dati di Twitter, siamo stati anche in grado di farlo vedere i modelli di movimento quotidiano delle persone con dettagli senza precedenti. Comprendere i modelli di mobilità umana, a sua volta, ha la capacità di trasformare la modellazione della malattia, aprendo il nuovo campo di epidemiologia digitale.

Per altri studi, abbiamo esaminato se i viaggiatori esprimono maggiore felicità su Twitter rispetto a quelli che rimangono a casa (risposta: lo fanno) e se le persone felici tendono a stare insieme in un social network (di nuovo, lo fanno). Infatti, la positività sembra essere cotta nel linguaggio stesso, nel senso che abbiamo più parole positive che parole negative. Questo non era il caso solo su Twitter, ma attraverso una varietà di diversi media (ad esempio, libri, film e giornali) e lingue.

Questi studi - e migliaia di altri come loro da tutto il mondo - erano possibili solo grazie a Twitter.

I prossimi anni 10

Quindi, cosa possiamo aspettarci di imparare da Twitter nei prossimi anni 10?

Alcuni dei lavori più interessanti attualmente riguardano la connessione dei dati sui social media con modelli matematici per prevedere fenomeni a livello di popolazione come le epidemie. I ricercatori hanno già avuto un certo successo nell'aumentare i modelli di malattia con i dati di Twitter per prevedere l'influenza, in particolare il FluOutlook piattaforma sviluppata dalla Northeastern University e l'Institute for Scientific Interchange.

Tuttavia, restano numerose sfide. I dati sui social media soffrono di un "rapporto segnale-rumore" molto basso. In altre parole, i tweet rilevanti per uno specifico studio sono spesso soffocati dal "rumore" irrilevante.

Pertanto, dobbiamo essere continuamente consapevoli di ciò che è stato soprannominato "Big Data Hubris"Quando si sviluppano nuovi metodi e non si è troppo sicuri dei nostri risultati. Connesso a questo dovrebbe essere l'obiettivo di produrre previsioni "vetrate" interpretabili da questi dati (al contrario delle previsioni "black-box", in cui l'algoritmo è nascosto o non chiaro).

I dati dei social media sono spesso (abbastanza) criticati per essere piccoli, campione non rappresentativo della più ampia popolazione. Una delle principali sfide per i ricercatori è capire come tenere conto di tali dati distorti in modelli statistici. Mentre più persone utilizzano i social media ogni anno, dobbiamo continuare a cercare di capire i pregiudizi in questi dati. Ad esempio, i dati tendono ancora a sovrarappresentare le persone più giovani a spese delle popolazioni più anziane.

Solo dopo aver sviluppato migliori metodi di correzione del pregiudizio, i ricercatori saranno in grado di fare previsioni del tutto confidenziali dai tweet.

Circa l'autore

Lewis Mitchell, docente di matematica applicata, Università di Adelaide

Questo articolo è stato pubblicato in origine The Conversation. Leggi il articolo originale.

libri correlati

at InnerSelf Market e Amazon