BIGDATA, EPISTEMOLOGIA, SCIENZA

Google Flu Trends e la fallibilità dei big data

Il libro Big Data (2013) di Viktor Mayer-Schönberger e Kenneth Cukier dedica un significativo numero di pagine al momento in cui, qualche anno fa, Google ha scoperto che possedere la più grande concentrazione al mondo di stringhe di ricerca – quel che ognuno di noi digita nel campo “cerca” del browser – equivale a poter esercitare un enorme potere predittivo sullo sviluppo di alcuni trend, fra cui quelli influenzali. Da allora, Google Flu Trends è diventato l’esempio portabandiera del movimento dei big data.

Un articolo di «Science» sembra oggi mettere in crisi questo ruolo. Anzitutto, nota l’articolo, Google Flu Trends ha completamente mancato di rilevare una influenza di non secondaria importanza, l’A-HIN1 del 2009. In secondo luogo, in seguito alla revisione del software avvenuta nello stesso 2009, i successivi risultati dell’algoritmo hanno continuato – e continuano – a generare previsioni dei flussi influenzali che risultano sovrastimate in termini di diffusione e durata.

Attestare la fallibilità di Google Flu Trends è per «Science» ghiotta occasione per mettere in luce quella che definisce la “hubris” dell’ideologia dei big data, cioè la pretesa che essi possano giungere a sostituire completamente i tradizionali metodi di raccolta e analisi di dati. Ridimensionare i big data, considerandoli strumento integrativo ad altri e non la “palla di cristallo” su cui molti entusiasti hanno creduto di poter mettere le mani, rappresenta senz’altro un modo più sensato per farne uso.

[ illustrazione: pubblicità Kleenex della fine degli anni ’20 ]