I dati pubblici sono un bene comune: intervista a Donata Columbro
Torna allo speciale #datibenecomune
Abbiamo chiesto a Donata Columbro, socia e co-fondatrice di Dataninja, di spiegarci meglio come nasce la petizione #datibenecomune, quali sono i suoi obiettivi e cosa significa data-informed. Insomma, di aiutarci a costruire un lessico minimo per parlare di un argomento complesso come quello dell’accessibilità dei dati pubblici.
Per iniziare, cos’è Dataninja?
Dataninja nasce nel 2012 come gruppo di lavoro spontaneo da Andrea Nelson Mauro e Alessio Cimarelli per fare inchieste basate sui dati. A oggi continuiamo le collaborazioni esterne con redazioni e aziende, ma con il tempo come Dataninja ci siamo concentrati sulla formazione ai dati. Quello che facciamo è portare la cultura dei dati tra le persone comuni che magari fanno lavori che apparentemente non c’entrano con la statistica, nelle aziende, nelle redazioni e nelle amministrazioni pubbliche. Nel 2019 abbiamo lanciato la prima scuola dedicata alla formazione sui dati, dove ora abbiamo nove corsi all’attivo. Ci rivolgiamo alle persone che vogliono imparare a trovare, analizzare e raccontare i dati.
Cosa significa fare data journalism? In che modo un articolo scritto con un approccio di data journalism è diverso da un articolo che, per esempio, fa il resoconto dei dati forniti dalla protezione civile giorno per giorno?
È ancora difficile spiegare esattamente cosa sia il data-journalism. C’è stata un’evoluzione del termine, ma si è iniziato a usarlo quando le capacità sia delle macchine che delle persone di raccogliere, interpretare e capire i dati hanno portato ad un livello d’inchiesta che prima non era possibile. Il data-journalism è una modalità di raccontare una storia, approfondire un fenomeno e analizzare una situazione utilizzando i dati, sia per aumentare il livello d’indagine che per presentare al pubblico le scoperte legate all’analisi in un modo visivo. Al data-journalism si accompagna di solito anche l’aspetto di presentazione al pubblico con grafici, infografiche interattive, mappe in cui l’aspetto preponderante della notizia è quello che i dati hanno fatto emergere.
Dataninja è una delle associazioni promotrici di Dati Ben Comune. Come nasce la petizione?
La petizione nasce il 25 ottobre, quando un nuovo DPCM del governo Conte decide di chiudere teatri, cinema, musei e cambiare gli orari dei ristoranti. Tutte le persone coinvolte nei mondi della cultura e della ristorazione hanno iniziato a lamentarsi, dicendo che non è in quei luoghi che ci si contagia, citando studi e dicendo di avere dati che dimostravano il contrario. In quel momento le persone hanno iniziato a cercare dati sul sito del Ministero della Salute e si sono rese conto di un problema di cui gli attivisti e i giornalisti parlano da sempre: moltissimi dati vengono dichiarati pubblicamente in conferenze stampa o passati in PDF ai giornalisti, ma non sono pubblici, non sono reperibili sul web. Ecco, l’unico modo che avremmo per capire davvero se il contagio avviene in quei luoghi è quello di avere dati, ma questi dati non li abbiamo. Eppure l’aveva detto anche l’accademia dei Lincei in un appello a maggio: tutti i dati sull’epidemia devono essere resi pubblici, la trasparenza dei dati è un valore fondamentale delle democrazie. Alle persone sembrava assurdo che quei dati non si trovassero e si chiedevano cosa fare. Quando poi Conte, la settimana successiva, ha fatto un nuovo DPCM in cui lui stesso ha detto che avrebbe reso i dati pubblici abbiamo fatto partire la petizione in quattro associazioni: On Data, di cui noi di Dataninja siamo soci, Transparency International, Action Aid e Scienza in Rete. In seguito abbiamo aderito anche come Dataninja. Ad oggi siamo arrivati a 146 realtà aderenti e più di 37000 firmatari. Abbiamo avuto adesioni anche da giornali, che sono quelli che in prima persona si trovano a rispondere alle domande dei cittadini, a dover raccontare le cose che vengono decise senza poterle confrontare con i dati.
Si parla di dati in formato open e di dati machine readable. Cosa significa?
Un dato pubblico è un dato prodotto da cittadini o tramite soldi pubblici: se non sono segreto di stato, un pericolo per la sicurezza o non ci sono motivi di privacy dovrebbero essere pubblici. Un dato dovrebbe essere consultabile dalle persone che lo scaricano, perché la trasparenza sia garantita ai massimi livelli. Parliamo quindi di formato aperto, non proprietario: Excel è un formato riutilizzabile ma proprietario, un formato aperto è per esempio il CSV. Un dato pubblicato in questo formato può essere scaricato, analizzato, rielaborato e poi raccontato dai giornalisti e dagli attivisti. Parliamo anche di licenza: i dati devono poter essere riutilizzati e quindi forniti con licenza aperta. C’è una scala che analizza la qualità dei dati pubblici: il livello base è quello di dati almeno disponibili online, anche solo in PDF in licenza aperta. Poi si sale: abbiamo il formato riutilizzabile, poi il formato aperto fino all’ultimo livello che è quello dei linked open data, dati contestualizzati e collegati ad altri. Più è alta la qualità dei dati, più i ricercatori, ma anche le aziende – se pensiamo ad esempio ai dati del trasporto pubblico – possono sfruttarli per analizzarli. Magari non in questo caso in cui si parla di pandemia e di contagio, ma gli open data possono anche aiutare il business.
La petizione parte quindi dai dati covid, ma il problema fondamentale che affronta è quello della reperibilità dei dati più in generale.
Il nome della campagna si riferisce proprio a questo: i dati pubblici sono un bene comune. Andrea Borruso, presidente di On Data, in un articolo su medium aveva paragonato i dati all’acqua come bene comune. A noi quello che interessa non è solo che le istituzioni forniscano dati aperti, riutilizzabili, disaggregati sul Covid, che sono fondamentali. Chiediamo anche che venga fatta una riorganizzazione della gestione dei dati pubblici, con referenti a livello regionale e nazionale. Questo è stato l’altro problema che abbiamo riscontrato, quello di non avere una persona specifica sul tema a cui rivolgere la petizione (indirizzata a Giuseppe Conte). Speriamo che questo aiuti ad affrontare il tema della trasparenza a prescindere dall’emergenza.
A più riprese avete parlato nei vostri canali social della pandemia di Covid19 come del primo evento data-informed della storia. Cosa significa? Quali conseguenze avrà nel panorama dell’informazione? Quello che vuol dire lo vediamo tutti i giorni: la nostra vita da dieci mesi a questa parte è appesa a un bollettino di numeri snocciolato ogni giorno alle 18, che ci dirà se potremo uscire di casa il giorno dopo. Questa quantità enorme di dati di solito la vediamo sotto le elezioni, quando c’è una grande mole di dati che arriva e che persone anche comuni si mettono ad analizzare. Ma quando questi dati finiscono in prima serata ogni giorno per dieci mesi di fila, allora stiamo assistendo a qualcosa di mai visto prima. Nel mondo dell’informazione ci sono stati diversi “episodi shift” che ne hanno cambiato i paradigmi. La seconda Guerra del Golfo e le televisioni con le news, le primavere arabe e il ruolo dei social media, gli attentati di Londra e il citizen journalism. Il fatto che oggi le persone comuni si rendano conto che i dati non ci sono, che li chiedano, che ne discutano è una cosa mai vista prima. Non sempre i giornali riescono a mettere i cittadini nella condizione di comprendere i dati, spesso mancano le competenze anche internamente alle redazioni e non è un discorso che vale solo in Italia. Il punto non è solo quello di avere i dati, ma anche una cultura del significato di alcuni termini che permetta la comprensione. Adesso se ne sente l’esigenza. Penso anche ad alcuni nuovi giornali, come Domani, nato in questo periodo, che nasce con un’impronta dedicata ai dati e ogni giorno in prima pagina c’è un pezzo che parla di dati. Un giornale nato anche solo poco tempo fa non sarebbe stato così.