BIGDATA, EPISTEMOLOGIA, SCIENZA

Google Flu Trends e la fallibilità dei big data

Il libro Big Data (2013) di Viktor Mayer-Schönberger e Kenneth Cukier dedica un significativo numero di pagine al momento in cui, qualche anno fa, Google ha scoperto che possedere la più grande concentrazione al mondo di stringhe di ricerca – quel che ognuno di noi digita nel campo “cerca” del browser – equivale a poter esercitare un enorme potere predittivo sullo sviluppo di alcuni trend, fra cui quelli influenzali. Da allora, Google Flu Trends è diventato l’esempio portabandiera del movimento dei big data.

Un articolo di «Science» sembra oggi mettere in crisi questo ruolo. Anzitutto, nota l’articolo, Google Flu Trends ha completamente mancato di rilevare una influenza di non secondaria importanza, l’A-HIN1 del 2009. In secondo luogo, in seguito alla revisione del software avvenuta nello stesso 2009, i successivi risultati dell’algoritmo hanno continuato – e continuano – a generare previsioni dei flussi influenzali che risultano sovrastimate in termini di diffusione e durata.

Attestare la fallibilità di Google Flu Trends è per «Science» ghiotta occasione per mettere in luce quella che definisce la “hubris” dell’ideologia dei big data, cioè la pretesa che essi possano giungere a sostituire completamente i tradizionali metodi di raccolta e analisi di dati. Ridimensionare i big data, considerandoli strumento integrativo ad altri e non la “palla di cristallo” su cui molti entusiasti hanno creduto di poter mettere le mani, rappresenta senz’altro un modo più sensato per farne uso.

[ illustrazione: pubblicità Kleenex della fine degli anni ’20 ]

BIGDATA, EPISTEMOLOGIA, LAVORO, TECNOLOGIA

Big data: di che diavolo si tratta?

Big data (2013) di Viktor Mayer-Schönberger e Kenneth Cukier fa chiarezza su un tema tanto chiacchierato quanto di fatto poco conosciuto. Che si voglia o meno descriverlo con la parola “rivoluzione” usata nel sottotitolo del libro, il fenomeno big data sta influenzando il nostro rapporto con la tecnologia. Sul fronte individuale, questo è testimoniato dalla grande diffusione di dispositivi e app di “personal tracking”; su quello business, dalla potenza dell’aggregazione di dati sfoderata da colossi come Google o Facebook e ora in corso di diffusione a più livelli in un insieme di imprese più ampio e diversificato.

Come Mayer-Schönberger e Cukier mettono in luce, l’efficacia predittiva dei big data rispetto a sistemi di indagine più tradizionali pare essere oggettivamente provata. Altrettanto certa pare la loro incapacità di dotare le previsioni di una motivazione. In altri termini, i big data danno risposte sul “cosa” ma non sul “perché” di quel che sta per accadere. Se confrontato con il classico paradigma causa-effetto, che guida tanto il decision-making più ponderato quanto le nostre scelte più intuitive – cioè i “blink”, come li definisce l’americano Malcolm Gladwell nel suo In un batter di ciglia – , un simile approccio risulta davvero sconvolgente.

La direzione verso cui l’uso dei big data sembra spingerci è quella in cui la certezza del poter dar ragione di un fenomeno analizzandone le evidenze e studiandone le cause viene sostituita da una piena – e spesso cieca – fiducia nelle capacità della tecnologia di prevedere quel che sta per accadere. Come Mayer-Schönberger e Cukier spesso ripetono nel loro libro, sapere “cosa” (e non “perché”) è il più delle volte sufficiente per prendere la decisione giusta al momento giusto. Ma quando la posta in gioco riguarda anche temi di innovazione, il discorso si fa diverso:

«Se Henry Ford si fosse affidato agli algoritmi di ricerca per sapere cosa voleva la gente, probabilmente avrebbe scoperto che tutti desideravano solo ‘un cavallo più veloce’ […]. In un mondo di dati dovranno essere incoraggiati gli aspetti più umani: la creatività, l’intuizione e l’ambizione intellettuale, perché la principale fonte di progresso è l’ingegno umano».

[ illustrazione: composizione grafica di autore ignoto ]