Dati di ricerca nelle biblioteche

Panel

Panel “Open Access to Research Data”.

In questi ultimi anni, abbiamo assistito ad un (lento) cambiamento di paradigma nel modo in cui i risultati della ricerca sono stati pubblicati e diffusi. Un fattore che potrà accelerare questo cambiamento è la spinta alla pubblicazione dei risultati della ricerca in modalità Open Access (OA)  e più di recente (2010) la spinta data dalla Commissione europea in direzione dell'”Open Science” evidenziata nella pubblicazione del Rapporto “Riding the Wave” . Questo Rapporto persegue non solo la pubblicazione dei risultati della ricerca OA, ma anche la pubblicazione OA dell’ “input per la ricerca”,  cioè della materia prima alla base del processo di ricerca, genericamente identificata come dati di ricerca.

Un Panel durante l’ultimo Convegno TPDL a Poznan (Polonia) ha discusso questo tema, per capire responsabilità, infrastrutture e ostacoli anche culturali da rimuovere. Il Panel è stato coordinato da Vittore Casarosa (CNR) ed ha avuto come relatori: David Giaretta (UK), Seamus Ross (Canada), Herbert Maschner (US), Cezary Mazurek (Poland), Andreas Rauber (Austria), Anna Maria Tammaro (Italia).

Giaretta ha introdotto il problema dell’organizzazione e della gestione dei dati di ricerca, che continua ad essere concentrato nella preservazione ma include anche la qualità dei contenuti e la sostenibilità economica. Per la Commissione europea i dati sono “oro” se sono beni comuni e possono essere riutilizzati. Come evitare il rischio temuto da Vint Cerf della “Digital dark age“? il problema tecnico dell’interoperabilità è solo la parte minore. Nell’ordine delle priorità, al primo posto c’è il coinvolgimento della comunità di ricerca e la sua partecipazione attiva: questa è la chiave del successo. Per aggiungere valore ai dati per la società nel suo insieme, occorre poi un Business model: chi paga? chi fa cosa? chi può riusare i dati? La norma  ISO 16363:2012 elenca i requisiti per la gestione dei depositi istituzionali: chi può assumersi il compito? Giaretta crede che il ruolo possa essere assunto dai bibliotecari, che hanno una buona reputazione e sono affidabili per problematiche di privacy e riservatezza, ma dovranno essere opportunamente educati e riqualificati per essere adeguati a questo compito. Biblioteca o Centro di dati che sia il valore aggiunto non sarà solo nei metadati e nella preservazione: il valore aggiunto sarà nella condivisione e nella connessione con altri dati, tenendo conto delle regole, dell’etica e della confidenzialità di alcuni dati.

Seamus Ross dell’iSchool di Toronto ha iniziato il suo discorso dichiarando che viviamo in una società dove ci sono dati dappertutto, ad esempio nei dispositivi android, nel ticket del ristorante, ecc.  Ci concentriamo sui dati scientifici, perché la ricerca è pagata con denaro pubblico ed il governo deve assicurarne il ri-uso da parte del pubblico. Il problema degli Open Data è che non abbiamo alcun controllo,  abbiamo bisogno di sapere da dove i dati provengono, chi ha creato e manipolato i dati, se la documentazione è affidabile. Grande differenza c’è tra i dati aperti e collezioni di dati digitali: una scala massiva di dati (Big Data) è meglio di una piccolissima collezione di materiale, ad esempio per la ricerca archeologica. Organizzare l’accesso ai Big Data è l’infrastruttura essenziale per l’e-Science. La problematica che ha evidenziato è che occorre dare competenze e offrire educazione appropriata per la cura dei dati, in particolare agli studiosi umanisti.

Herbert Maschner dell’Idaho State University è un archeologo attualmente Direttore Center for Archaeology, Materials, and Applied Spectroscopy (CAMAS). L’Open Access ai dati rappresenta per lui la democratizzazione dell’università e della formazione superiore. La ricerca negli Stati Uniti è pagata dalle tasse e  per ogni 100.000 dollari c’è il supporto di 62 famiglie pagano le tasse, a cui bisogna dar conto su cosa si sia fatto coi loro soldi. Ogni collezione digitale deve assicurare l’integrità dei dati ed offrire il patrimonio al mondo per tutti quelli che vogliono usarlo, per rendere l’umanità più istruita. Per la formazione di personale, studiosi ed amministratori, quali che siano le tipologie di dati e le metodologie disciplinari per la loro creazione, le competenze sono le stesse con le stesse tecniche e simili problematiche.

Rauber dell’ Università Tecnica di Vienna crede che non sia così necessario cercare prima di tutto di motivare e coinvolgere la comunità di ricerca, trovando stimoli di carriera, come citazioni ed altre forme di incoraggiamento. Ciò di cui abbiamo bisogno è di accelerare la ricerca con la condivisione dei dati per fornire elementi di prova per il lavoro di ricerca, la condivisione OA deve essere una normale pratica scientifica per migliorare la conoscenza e la collaborazione per l’analisi dei dati viene stimolata dall’accesso facile ai dati!  Se concentriamo l’attenzione sui dati della ricerca, questo può essere sbagliato, dobbiamo concentrarci sul processo della ricerca, cercando di analizzare il processo e non i dati da utilizzare. L’obiettivo è quello di fornire l’infrastruttura velocemente per dare l’evidenza della necessità dei dati aperti. In altre parole, l’esistenza di un servizio integrato che raccolga automaticamente i dati e i metadati, incluso i dati dinamici, porterà inevitabilmente i ricercatori a condividere i dati per un riutilizzo flessibile degli stessi e la loro ri-proposizione anche interdisciplinare.

Cezary è ricercatore in un Centro di dati, che si occupa in particolare della gestione di dati riguardanti le scienze biomediche. Il valore dei dati in questo caso è evidente, perché può salvare la vita, ridurre i costi del trattamento, scoprire nuove malattie. L’analisi dei dati è un lavoro collaborativo tra l’informatico, lo specialista, il ricercatore ed usa dispositivi intelligenti che consentono la manipolazione dei dati.

Nel mio intervento ho potuto riprendere l’argomento di Giaretta a favore di un nuovo ruolo delle biblioteche, sintetizzando la discussione e gli ostacoli incontrati dalla comunità bibliotecaria ad assumersi questo ruolo per i dati di ricerca, a cominciare dalla prevenzione di alcuni studiosi. Il valore aggiunto che le biblioteche possono dare alla nuova comunicazione scientifica va oltre la gestione dei depositi istituzionali e si concentra su due aspetti essenziali per il servizio: 1) dare le capacità e 2) favorire la collaborazione anche interdisciplinare tra gli studiosi.

Al Panel è seguita una discussione animata, in cui si sono evidenziati due approcci complementari: quello degli informatici concentrato sull’infrastruttura e quello dei bibliotecari concentrato sugli ostacoli culturali ed organizzativi. Concludo con le parole di Giaretta che mi hanno particolarmente colpito e che qui riassumo con parole mie: per realizzare la nuova comunicazione scientifica non basta l’infrastruttura, serve “pain” cioè proprio soffrire per realizzare il cambiamento superando le molte difficoltà che ciascun agente di cambiamento trova nel suo contesto.  La determinazione è quindi una caratteristica essenziale se si vuole realizzare il ruolo di gestire gli Open Data in biblioteca.

Vorrei riportare questa interessante discussione in Italia durante la settimana dell’Open Access: quali biblioteche in Italia gestiscono i dati creati nelle loro istituzioni? quante stanno cominciando a proporsi per gestire i dati di ricerca?

Pubblicità
  1. Lascia un commento

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: