Cuciniamo un po' di "coerenza dei metadati"
Ixchel M. Faniel, Ph.D.U
Supponiamo che tu stia scrivendo un libro di cucina e debba descrivere gli ingredienti. Sicuramente vorrai che ci sia una certa coerenza tra una ricetta e l'altra. Se non vuoi confondere i tuoi lettori, sarà opportuno che tu non ti riferisca a una determinata quantità come "un pizzico" in una ricetta e "un goccio" o "un tantino" in un'altra.
Poi ti guardi intorno e ti rendi conto che anche altre persone scrivono libri di cucina e adottano degli standard. Per loro non è un pizzico, ma un cucchiaino per alcuni o 5 millilitri per altri. Quello che tu chiami "pezzo", gli altri lo chiamano "quarto di tazza" o "32 grammi". Quindi, è necessario essere coerenti non solo con il proprio ricettario, ma anche con quelli degli altri, indipendentemente dal piatto che si sta preparando: arrosti, fritti, dolci, zuppe,ecc.
Anche i bibliotecari e gli archivisti dei repository di dati stanno imparando a pensare in questo modo. Perché i dati archiviati per essere riutilizzati hanno un valore molto maggiore per le loro istituzioni quando i metadati ad essi collegati sono coerenti a livello di studio, di dati e di file.
Metadati per la discovery e il riutilizzo
La conservazione dei dati è costosa, quindi tutto ciò che può essere fatto per giustificare meglio le spese è positivo. A mio avviso, la giustificazione definitiva sta nel riutilizzo e nella citazione dei dati, che è esattamente il motivo per cui i dati sono stati archiviati. Ma il primo passo è scoprire che i dati esistono.
In un recente articolo di cui sono stato coautore insieme a Jihyun Kim ed Elizabeth Yakel per la rivista College & Research Libraries , abbiamo visto che termini di metadati simili in tre diverse discipline - archeologia, scienze sociali quantitative e zoologia - non sono usati in modo così coerente come potrebbero. Ciò ha delle implicazioni per quanto concerne la discovery e il riutilizzo.
Non si tratta solo di ottenere coerenza per amore della coerenza in sé.
La tabella 7 del nostro articolo illustra alcune delle incongruenze tra i metadati che abbiamo individuato. Ancora più preoccupanti sono state le incongruenze nelle definizioni associate ai termini dei metadati, sia all'interno delle singole discipline che tra di esse. Ad esempio, il termine "Coverage" è definito come un lasso temporale. Se si considerano le varie
discipline, il lasso temporale può rappresentare il momento della raccolta dei dati o il periodo di tempo cui si riferiscono i dati (ad esempio, periodi culturali o radiocarbonici). Inoltre, così come viene definito e utilizzato, il termine "Coverage" si sovrappone al termine "Data", un altro periodo di tempo che tende a identificare le date di raccolta dei dati, ma anche le date di lavoro sul campo, le date di deposito dei dati, le date di firma dei donatori e dei curatori e i periodi di embargo dei dati, solo per citarne alcuni.
Questa tipologia di incoerenze si ripercuote sulla discovery e sul riutilizzo dei dati, sia all'interno che all'esterno delle singole discipline. Non possiamo permetterci il lusso di costruire un enorme archivio che contenga tutti i dati del mondo o un gigantesco motore di incrocio dei metadati. Pertanto, la catalogazione per la discovery, utilizzando termini e definizioni coerenti tra i vari archivi, è fondamentale se vogliamo che i dati e i metadati ad essi associati possano risultare visibili per essere riutilizzati in ogni modo immaginabile.
Archiviazione dei dati contestualizzati, interoperabilità, spiegazioni d'uso
Abbiamo dedicato molto tempo all'esame della procedura di documentazione dell'archiviazione dei dati. In realtà, essa ha il duplice scopo di definire un contratto tra archivianti e repository e di raccogliere informazioni sui dati archiviati. È una parte fondamentale del flusso di lavoro che sta alla base di tutti i repository.
Alla luce dei nostri risultati, discutiamo anche tre implicazioni per la curatela dei dati e le
mettiamo in relazione con i FAIR Guiding Principles per la gestione responsabile dei dati
scientifici. In particolare:
La necessità di informazioni sufficienti sul contesto
L'uso di un vocabolario basato su standard per favorire l'interoperabilità
La necessità di informazioni specifiche sulla licenza d'uso dei dati
Si tratta di un argomento complesso e c'è molto lavoro da fare. Anche se i repository di dati non costituiscono sempre il primo tipo di lavoro che viene in mente quando si pensa di diventare bibliotecari o archivisti, spero di riuscire a entusiasmarti o, almeno, a suscitare il tuo interesse riguardo a questa importante idea:
I bibliotecari e gli archivisti possono contribuire a creare una coerenza nei metadati tale da creare un ponte tra i ricercatori e i repository, aumentando così notevolmente la discovery, il riutilizzo e il valore degli investimenti in ricerca delle loro istituzioni.
È un lavoro che i bibliotecari e gli archivisti sono già molto bravi a fare, solo che ora può essere svolto in modi nuovi ed entusiasmanti. L'OCLC Research Library Partnership Metadata Managers Focus Group ne è un esempio: i membri condividono informazioni su argomenti di interesse comune. Nel 2020, il gruppo intende discutere il ruolo fondamentale dei metadati nel nostro ambiente di ricerca, dalla pianificazione della ricerca alla creazione e gestione dei dati, alla diffusione delle conoscenze e alla comprensione dell'impatto che la condivisione, la cura e il riutilizzo dei dati hanno sui ricercatori e sulle loro istituzioni.
Portare la profonda esperienza di catalogazione dal mondo della stampa e del digitale a quello della curatela dei dati è un po' come tornare a cucinare i piatti preferiti dell'infanzia.Conosciamo i risultati, sappiamo esattamente che sapore dovrebbe avere il piatto, ma le istruzioni non sono facilmente trasferibili alla cucina moderna. Pertanto, dobbiamo affidarci agli standard e tradurre attentamente ogni fase per garantire la coerenza.
Si tratta di un lavoro incredibilmente importante. E sta diventando sempre più essenziale, dato che gli istituti di ricerca stanno cercando modi per sfruttare i loro investimenti e aumentare la portata dei loro brand.
Il seguente articolo è stato pubblicato originariamente su OCLC Next.