giovedì 23 aprile 2020

Quando le istituzioni danno i numeri

Dall'inizio dell'emergenza coronavirus è diventata una consuetudine trovarsi a guardare i grafici più disparati: l'andamento del numero dei contagi, dei ricoverati in ospedale/in terapia intensiva, delle vittime, dei guariti, la famosa crescita esponenziale...


E Flatten the curve è diventato l'imperativo di questa pandemia.


Ma a quanto pare tutto questo non implica la diffusione di una maggior dimestichezza coi dati.
Stamattina mi sono imbattuta in questo post scritto dalla ricercatrice sarda Michela Didu, laureata in Data Science, allo scopo di criticare il report pubblicato dalla RAS - Regione Autonoma della Sardegna per presentare una serie di statistiche descrittive relative al COVID-19.
Michela, da data scientist qual è, non ha potuto fare a meno di stigmatizzare il grossolano errore commesso nel disegnare il grafico mostrato qui sotto (ma anche altri).
colui o coloro che hanno elaborato questo documento non hanno la minima idea di cosa siano i principi e le basi della statistica che sono necessari e imprescindibili per una qualsiasi analisi.
In statistica, per esempio, un grafico a torta è un cerchio diviso in settori che rappresentano ciascuno una proporzione del TUTTO.
Quindi, inserire il totale (1.300.500, come nell’esempio sotto) all’interno della torta in forma di fetta è ampiamente sbagliato in quanto il totale in sé è già il TUTTO, quindi la torta per intero, e non può essere quindi una fetta, ovvio no?
Il rischio è quello di trasmettere informazioni che sono sbagliate o fuorvianti, le quali vengono lette dai cittadini per poi trarre delle conclusioni sbagliate e trasmettere falsa informazione. Da qui, una reazione a catena che tutti conosciamo.
Ora, mi rendo perfettamente conto che in questo periodo ci sarebbero questioni ben più serie di cui discutere... ma questa non è una scusa per fare le cose alla carlona dando informazioni palesemente scorrette. Già di questi tempi avere dati affidabili è un'utopia; il fatto che sia il numero dei contagi sia quello delle vittime siano più o meno largamente sottostimati, soprattutto a causa dell'insufficiente numero di tamponi effettuati, è oramai una certezza. Se poi i dati disponibili vengono presentati senza applicare il necessario rigore – «tanto chi vuoi che se ne accorga», temo sia un pensiero abbastanza ricorrente ai piani alti – allora mi sento francamente presa in giro...
Per alleggerire un po' il tono, concludo con un paio di simpatici memi dedicati ai cosiddetti pie chart, ossia appunto i diagrammi a torta, e ai bar chart (ortogrammi).


Nessun commento:

Posta un commento