La gestione della pandemia causata dal Covid-19 ha messo in evidenza due fatti fondamentali. Il primo: che raccogliere dati è necessario per ottenere conoscenza. Il secondo: che i dati di per sé stessi non significano conoscenza, ma anzi, che raccogliere dati poco affidabili apre le porte al caos.
Abbiamo potuto constatare infatti quanto sia importante raccogliere dati capillari sullo sviluppo della pandemia nei diversi distretti sanitari italiani, come ad esempio il numero di tamponi, il numero dei casi positivi, e il numero dei ricoverati in terapia intensiva.
Sulla base di questi dati sono state prese delle decisioni importantissime a livello strategico: quali attività tenere aperte, che forme di distanziamento sociale mettere in pratica, e così via. Allo stesso tempo, abbiamo osservato quanto sia complicato utilizzare questi dati per ricostruire una visione coerente della realtà. Più nello specifico: i numeri, da soli, non significano nulla. Per poterli interpretare e confrontare dobbiamo sapere come e quando sono stati raccolti, con che criteri sono stati processati, come sono stati aggregati e, infine, comparati.
Due esempi per tutti.
Il primo: la difficoltà di decidere se qualcuno è venuto a mancare “a causa del coronavirus”.
Il secondo: la difficoltà di calcolare il numero di tamponi positivi giorno per giorno, quando i dati sono invece raccolti alla sorgente con un margine di tempo più ampio (ad esempio: settimanale).
Tutto questo ci comunica un concetto molto semplice, ma purtroppo ampiamente sottovalutato: che bisogna impiegare i migliori esperti non solo per raccogliere, processare, trasformare e visualizzare i dati, ma in primis per associare ai dati una descrizione chiara di quale sia il loro significato.
Questa attività in informatica si indica col termine “modellazione concettuale”. Si tratta di un’attività che molti in informatica considerano tediosa e talvolta inutilmente complessa: richiede tempo, pazienza e la capacità di mettere assieme le competenze tecniche di un informatico con quelle di chi conosce il contesto dei dati (in questo caso medici, epidemiologi, e chi più ne ha più ne metta).
Ma è un’attività imprescindibile, perché è solo comprendendo il significato dei dati in tutte le loro sfumature che si può ottenere una visione fedele della realtà.
In altre parole: quando si va a cercare l’oro, non importa chi arriva prima, importa chi ha il setaccio migliore.
Autore: Marco Montali