Le cose, le persone, le attività, tracciate riga per riga: li chiamiamo Open Data

Il 3 ottobre 2012 è stato reso disponibile ai cittadini il sito Open data dell’Amministrazione di Roma Capitale, in occasione di un evento di presentazione a cui hanno partecipato, oltre ai rappresentanti dell’Amministrazione, esperti del settore.
I materiali che attestano i contributi realizzati a partire da quella data si possono trovare sul sito del Dipartimento Trasformazione Digitale di Roma Capitale nella sezione dedicata agli OD: (http://dati.comune.roma.it/cms/it/homepage.page).

In questo contesto anche l’Istituzione delle Biblioteche di Roma ha sin da subito dato il suo contributo pubblicando in primis alcune informazioni di base (per es. l’anagrafica delle sedi) e report di dati statistici.
Successivamente, a partire dall’autunno 2017, le Biblioteche di Roma hanno iniziato a produrre nuovi set di dati che, se visti nel loro insieme, compongono un’ ampia ed analitica panoramica descrittiva della rete delle biblioteche romane, dei servizi offerti ai cittadini e della platea dei fruitori di questi servizi.
Si tratta di una proposta inedita che, in mancanza di analoghe precedenti esperienze in ambito bibliotecario, ha vissuto una naturale evoluzione: sono state integrate in corso d’opera le scelte iniziali utilizzando le prime tabelle prodotte come base di riflessione ed esperienza costruttiva.

Di seguito l’indice dei file prodotti ad oggi, tutti generati automaticamente tramite estrazione dal data base informatico, pubblicati sul portale delle biblioteche di roma (www.bibliotechediroma.it/open-data-biblioteche-di-roma) e replicati sul portale di Roma Capitale:

Una buona quantità di estrazioni organizzate in 3 gruppi; le informazioni descrittive di ogni file sono contenute nella scheda del singolo OD. Di seguito un esempio:


Open Data Elenco Utenti anagrafica Biblioteche di Roma

Open Data generato con cadenza annuale. Generato in data 25/07/2017.

Permette di avere un quadro completo delle caratteristiche anagrafiche degli utenti iscritti alle Biblioteche di Roma. Open Data volutamente priva di dati sensibili.

Disponibile nei formati:

  • CSV
  • Excel
  • JSON

Open Data che contiene informazioni dettagliate sull’anagrafe utenti delle Biblioteche di Roma, qui di seguito elencate in dettaglio:

CAMPI OPEN DATA DESCRIZIONE
Iscrizione utente Data completa iscrizione utente
Anno iscrizione utente Anno iscrizione utente
Cod. provenienza utente Codice Provenienza utente
Provenienza utente Provenienza utente (descrizione provenienza)
Età utente Età utente
Sesso Composizione dei campi: Tipo (G=soggetto giuridico, F=persona fisica) + Sesso (F=femmina, M = maschio)
Sigla Provincia provincia Siglia
Provincia Provincia
CAP Codice avviamento Postale
Città Utente Città utente
Codice Paese Codice Paese utente
Paese utente Paese utente
Cod.Nazionalità Codice nazionalità utente
Nazionalità utente Nazionalità utente
Cod.Biblioteca Codice Biblioteca iscrizione utente
Biblioteca utente Biblioteca iscrizione utente

Licenze

Tutti gli Open Data pubblicati sul portale BiblioTu seguono le norme della licenza Creative Commons 4.0 Attribuzione (CC BY 4.0), ad eccezione dei casi in cui siano esplicitamente indicate altre condizioni di uso. Pertanto, a meno che non sia specificato diversamente, i contenuti possono essere liberamente riprodotti e utilizzati purché ne venga citata in ogni occasione di utilizzo la fonte (https://www.bibliotechediroma.it) e gli autori ovvero l’Istituzione Biblioteche di Roma.

Nel caso in esempio, si è scelto di generare gli OD con cadenza annuale: una fotografia scattata in un determinato momento dell’anno, utile per monitorare l’andamento generale degli iscritti alle Biblioteche.
La pubblicazione avviene in 3 diversi formati ciascuno dei quali è caratterizzato da più campi brevemente descritti in elenco per semplificarne la comprensione e l’utilizzo.
La pagina di copertina degli OD si completa con l’indicazione della licenza di riuso.
In 2 distinti punti della pagina web, iniziale e finale, è presente il pulsante di colore rosso che invita a procedere con il download del file.
Inoltre queste pagine web, una per ogni OD, sono realizzate nel rispetto delle regole di copywriting del web ed applicano strategie SEO, con l’intenzione di renderle facilmente reperibili dai motori di ricerca, in particolare Google.

Perché produrre Open Data? A chi possono interessare?

Il riuso, attraverso la pubblicazione con licenza libera, è il primo scopo acclarato di questo servizio ma, in realtà, non appena preso contatto con i primi elenchi dei nostri OD, questi si sono trasformati immediatamente in strumenti di lavoro e stimoli di riflessione interna.
Se la produzione dei dati statistici annuali offriva una visione globale e sintetica dell’andamento dei nostri servizi, gli OD sono un strumento di analisi dettagliatissimo, da interrogare per meglio comprendere il nostro operato e l’interazione con gli utilizzatori.

Il primo banale risultato è stato quello di portare in evidenza, in “testa” ed in “coda” di alcune tabelle, una serie di errori o incongruenze che in un data base con oltre 130.000 soggetti in anagrafica e con circa 1 milione di transazioni l’anno è inevitabile riscontrare; ne è scaturito un primo intervento correttivo di ripulitura dei dati.
Inaspettatamente, quindi, gli OD prodotti si sono rivelati uno strumento di lavoro a disposizione degli stessi autori.
I campi contenuti nei set di OD prodotti non sono stai inseriti a caso: a titolo di esempio, la scelta di inserire il CAP come dato di geolocalizzazione in tutti i nostri principali set.
Il CAP rappresenta un esempio di contenuto dal grande valore informativo la cui pubblicazione non mette a rischio l’anonimato delle informazioni ma è sufficientemente analitico da poter consentire degli studi aggregati, legati al territorio. Una novità il cui potenziale è ancora tutto da valutare.
Altrettanto importante la scelta di produrre, nel gruppo “altri dati”, una serie di set dedicati alle card, che ci consente di studiare gli andamenti delle tessere anche rispetto agli indici di fidelizzazione o di espansione delle biblioteche sul territorio.

È sufficiente scaricare ed aprire uno dei file con il foglio elettronico per rendersi conto di quante informazioni si possono recuperare. L’applicazione, semplice e immediata, di una tabella pivot o di semplici filtri sulle colonne permette di estrapolare subtotali e fornisce evidenze e chiavi di lettura inedite, sino ad oggi non previste nelle statistiche preimpostate.
Naturalmente, gli “addetti ai lavori” sapranno applicare anche algoritmi e formule complesse per estrarre risultati sufficientemente sintetici da potere essere utilizzati come indicatori, avendo a disposizione le componenti idonee a produrre una ricostruzione multidimensionale dell’attività dell’organizzazione.

Non solo la produzione di OD consente elaborazioni complesse e analitiche rispetto ai dati statistici “tradizionali” ma già una lettura superficiale è in grado di comunicare un dato, come per esempio il numero di utenti iscritti con la tessera annuale valida in un determinato momento, che fino a ieri era erroneamente assimilato al totale degli “utenti attivi” nell’anno.
Infatti il dato “utenti attivi”, che è recuperabile dal software utilizzando le normali funzionalità di produzione delle statistiche, tiene conto soltanto degli utenti che hanno effettuato almeno una transazione nel periodo preso in esame, non tiene in alcun conto, invece, di tutti quegli iscritti che sottoscrivono la tessera per accedere ad altri servizi, come per esempio il WiFi, che devono essere considerati a tutti gli effetti utenti della biblioteca.
Questa ricchezza di informazioni è pertanto preziosa prima di tutto per conoscere meglio la nostra organizzazione e chi la frequenta; a fronte di un mondo esterno in rapida trasformazione, anche gli strumenti di misurazione devono essere velocemente adeguati.

Dovremo attendere la produzione di almeno un intero anno di scarichi prima di avviare un lavoro interno, organizzato, inedito, per l’elaborazione di tutte queste informazioni ma sicuramente la loro pubblicazione costituisce una interessante novità che potrebbe tornare utile anche per altri operatori nel settore della cultura come le librerie, le scuole, i teatri.
Certo è che, da un primo esame in rete, alla ricerca di altri OD che potrebbero efficacemente incrociarsi con i nostri non emerge una particolare ricchezza o varietà.
Ciò che è disponibile in internet sono prevalentemente dati statici, anagrafiche, cataloghi o archivi, mentre sarebbe interessante poter confrontare dati dinamici, come quelli dei nostri prestiti con quelli delle vendite di libri o dati provenienti dalle scuole nello stesso ambito territoriale per comprendere se le nostre azioni sono in grado di produrre effetti concreti.
I confronti possono essere basati sull’incrocio di fonti di diverse provenienze contenenti una chiave comune, come per esempio il titolo di un’opera, il CAP, la data di nascita (che consente di focalizzare una specifica fascia di età), oppure utilizzare la data ovvero la chiave cronologica per comparare gli andamenti dei diversi servizi erogati, utilizzati o venduti.
Il legame tra gli OD può generare nuove visioni d’insieme e importanti evidenze.

La prima ipotesi di riuso degli OD, nel 2012, in occasione dell’evento di presentazione organizzato da  Roma Capitale, legata principalmente all’utilizzo di questi tramite le APP,  è oggi da ritenersi parzialmente superata.  Gli OD sono oggi, più che mai, un potentissimo strumento di supporto alla comprensione ed alla governance di fenomeni complessi, dove la produzione, il possesso e la possibilità di incrocio di grandi quantità di dati, i big data, offre chiavi di lettura prima non ipotizzabili.
Certamente questi scenari richiedono professionalità in grado di sviluppare nuove visioni, di immaginare, prima ancora che di elaborare, i big data.

Nel mondo ristretto delle biblioteche è gratificante essere almeno tra i primi produttori concreti! Nel futuro, siamo convinti che gli OD saranno una delle novità più stimolanti, essendosi svelati come uno strumento di analisi irrinunciabile nello sviluppo di piani industriali soprattutto laddove è il territorio che si esprime attraverso i grandi numeri, sicuramente utilissimo per le nostre piccole e medie imprese in ambito profit e non, come per la pianificazione degli interventi in ambito sociale ed urbanistico da parte delle Pubbliche Amministrazioni.

Massimo Greco

Annunci

Un pensiero riguardo “Le cose, le persone, le attività, tracciate riga per riga: li chiamiamo Open Data

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...