Big data: “quattro V” e un esempio di oggi

Interrompiamo la serie di articoli sulla didattica a distanza per riflettere su alcuni temi centrali di grande attualità, soprattutto in considerazione degli eventi drammatici di questi giorni.
Nella nostra rubrica abbiamo sempre, implicitamente o esplicitamente, parlato dei dati come condizione necessaria e motore per la realizzazione di servizi nella città digitale. Parlare di dati evoca immediatamente aggettivi e connotazioni legate all’enorme quantità degli stessi, e alle corrispondenti difficoltà tecniche e umane per immagazzinarli, processarli, comprenderli. Immagino tutti voi abbiate sentito, almeno una volta nella vostra vita, il termine “big data”, a enfatizzare appunto l’enorme “volume” dei dati con cui abbiamo a che fare quotidianamente.
È importante ricordare che il “volume” rappresenta solo una delle cosiddette “quattro V” dei big data. Scopriamo le altre tre.
Innanzitutto, c’è la “velocità”: enormi quantità di nuovi dati vengono prodotte in ogni minuto della nostra vita. Secondo l’infografica “Data Never Sleeps 9.0” di Domo, facilmente reperibile sul web, in un minuto accadono fenomeni come 167 milioni di video visti su TikTok, 6 milioni di acquisti online, 856 minuti di incontri contemporanei su Zoom, 452000 ore di film e serie visualizzati su Netflix.
C’è poi la “varietà”: abbiamo dati rappresentati in forma strutturata (come tabelle e record nei database), semi-strutturata (come report e grafici), o non strutturata (come immagini, video, registrazioni vocali, testo libero).
C’è infine la “veridicità”: spesso non sappiamo se i dati che raccogliamo sulla realtà rappresentano davvero una descrizione accurata e fedele della realtà stessa. Pensate ai ben noti fenomeni delle fake news o di immagini e video artefatti, ma anche al fatto che spesso i dati non raccontano fatti, bensì opinioni.
Queste “quattro V” si ritrovano in tutta la loro problematicità nei dati, drammatici, che costantemente ci arrivano dalla guerra in Ucraina: tantissimi dati, in continua evoluzione, di vario tipo, e spesso difficilmente verificabili. Un esempio, diretto e forte, in questo senso è reperibile al sito https://maphub.net/Cen4infoRes/russian-ukraine-monitor, che mostra sulla mappa dell’Ucraina e dintorni una varietà di dati pescati automaticamente dai social network, sfruttando il fatto che foto, video, e testi vengono sempre implicitamente associati al “dove” e “quando”, registrando la località e il momento in cui sono stati caricati. Un esempio che mostra in fondo una “quinta V”: il “valore” implicitamente presente in questi dati, e la difficoltà e responsabilità che dobbiamo mettere in campo per poter effettivamente trasformare i dati in valore.

Autore: Marco Montali

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *