Identificatori persistenti nel patrimonio culturale
Ringrazio Liz Krznarich, Adoption Manager di DataCite e ROR per aver contribuito a questo post sul blog riservato agli ospiti.
Perché abbiamo bisogno di identificatori persistenti per il patrimonio culturale? Questo post fa parte di una serie di resoconti di conversazioni sulla transizione alla prossima generazione di metadati in Spagna.
È stato entusiasmante avere l'opportunità di intervenire a questo evento e di condividere le mie conoscenze in qualità di Adoption Manager di DataCite e ROR. Mi premeva in particolare discutere dell'uso degli identificatori persistenti (PID) per gli oggetti e le collezioni storico-culturali, dato che negli ultimi tempi questo argomento ha suscitato grande interesse nella comunità di DataCite.
Qual è il valore degli identificatori persistenti per gli oggetti che fanno parte del patrimonio culturale?
Gli identificatori persistenti sono un tipo speciale di URL (uniform resource locator) che consente agli utenti di trovare sempre in modo affidabile una risorsa a quell'URL, indipendentemente dal fatto che la sua posizione effettiva sul Web cambi.
L'uso dei PID è importante in un contesto accademico, in quanto consente ai ricercatori di fare riferimento a una risorsa online nelle loro pubblicazioni e di essere certi che il riferimento rimanderà, nel tempo, sempre alla stessa risorsa. La citazione delle risorse tramite PID, a sua volta, consente di tenere traccia delle citazioni e del riutilizzo in modo continuo e automatico. I PID possono anche favorire la discovery degli oggetti e dei loro metadati, in quanto i fornitori di servizi PID offrono API agli aggregatori e agli indicizzatori (e, nel caso di DataCite, a chiunque) che fungono da "sportello unico" per i metadati di milioni di oggetti.
Quali PID vengono utilizzati per gli oggetti che fanno parte del patrimonio culturale?
Negli ultimi anni i PID si sono affermati nel settore dei beni culturali, con molti tipi diversi di identificatori ora in uso. Il progetto Heritage PIDs, recentemente completato, fornisce un elenco eccellente e completo di funzionalità PID: quale identificatore persistente fa cosa? Molti di questi identificatori sono specifici per una particolare area tematica o tipo di oggetto; tuttavia, alcuni sono di uso generale e comunemente utilizzati per molti tipi di oggetti facenti parte del patrimonio culturale: handle, Archival Resource Keys (ARK) e Digital Object Identifiers (DOI).
No Name Road dell'utente Flickr NatalieMaynor (CC BY 2.0)
- Handle: Il Sistema Handle consente alle istituzioni di gestire il proprio servizio PID, il che significa che gli identificatori sono registrati e risolti localmente. Si tratta di una soluzione molto efficace dal punto di vista dei costi, in quanto l'identificatore non comporta alcun costo diretto; tuttavia, la gestione di un'implementazione locale dell'Handle comporta responsabilità di manutenzione a lungo termine. Sebbene alcuni software di raccolta digitale incorporino la registrazione/risoluzione di Handle, questa dipendenza significa che se si decide di migrare il software, potrebbe essere necessario migrare anche l'implementazione dell'Handle. Inoltre, il sistema Handle non supporta la registrazione dei metadati, quindi non offre i vantaggi della discovery dei metadati aggregati.
Esempio di Handle: il Rijksmuseum - ARK (Archival Resource Key): ARK è un sistema basato su Handle sviluppato da California Digital Library Identifier Services. Come Handle, ARK è decentralizzato: molte istituzioni gestiscono la propria istanza di un servizio ARK. Gli ARK possono tuttavia essere risolti globalmente dal servizio Name-to-Thing (N2T). ARK supporta la registrazione dei metadati, il che significa che i metadati possono essere mostrati tramite API indipendentemente dall'oggetto stesso. ARK, tuttavia, non detta uno schema di metadati standard, il che può rendere difficile il consumo dei metadati da parte di aggregatori e indicizzatori.Esempio ARK: Le Louvre
- DOI (Digital Object Identifier): il sistema DOI è una specifica implementazione globale del sistema Handle, governato e gestito dalla International DOI Foundation (IDF). I servizi di registrazione e risoluzione DOI sono forniti alle istituzioni da agenzie di registrazione, che servono diverse aree geografiche e/o tipi di risorse. Oltre alla registrazione e alla risoluzione centralizzata, i DOI richiedono la registrazione dei metadati e ogni agenzia di registrazione DOI ha uno schema di metadati standard. Ciò consente agli indicizzatori e agli aggregatori di consumare in modo affidabile i metadati DOI in modalità di lettura automatica.
Esempio di DOI: University College di Dublino
Come scegliere un PID?
Il PID "giusto" per le vostre collezioni/oggetti dipende dal vostro caso d'uso specifico. Alcune valutazioni includono:
- Costi: gestire la propria istanza di un sistema Handle o ARK comporta costi indiretti a lungo termine per mantenere l'infrastruttura locale e il personale, ma nessun costo diretto per identificatore. La registrazione di nuovi DOI comporta costi diretti per l'identificatore, ma costi indiretti limitati.
- Persistenza/sostenibilità a lungo termine: la governance garantisce la sostenibilità delle basi sociali e tecnologiche di un sistema PID. Nel caso dei DOI, esistono più livelli di governance: l'infrastruttura e la gestione del DOI globale sono governate a livello di DOI Foundation e ogni agenzia di registrazione mantiene il proprio modello di governance. DataCite, ad esempio, è un'associazione senza scopo di lucro governata dai suoi membri e dal consiglio direttivo, con la guida di gruppi di lavoro e di indirizzo della comunità. Indipendentemente dal tipo di PID, la persistenza richiede il mantenimento responsabile dell'indirizzo di localizzazione effettivo di una risorsa in un registro PID, cosa che rimane una responsabilità dell'istituzione.
- Supporto della comunità: Handle, ARK e DOI hanno tutti una forte comunità di utenti a livello globale, e tutti offrono in qualche misura servizi di assistenza. Le agenzie di registrazione DOI offrono, in genere, un supporto più completo e risorse per il coinvolgimento della comunità, oltre a strumenti e servizi a valore aggiunto, su misura per le loro specifiche comunità. Ad esempio, DataCite partecipa attivamente alle attività e ai gruppi della comunità che si occupano dello sviluppo di standard e best practice per le risorse e gli output accademici non tradizionali. Le agenzie di registrazione investono anche in strumenti e servizi che sfruttano i DOI e i loro metadati, come DataCite Commons.
Altre domande da considerare sono:
- Quanto persistenti e quanto globali vuoi che siano gli identificatori dei tuoi oggetti o delle tue collezioni?
- A quanti elementi vuoi assegnare gli identificatori persistenti? Alcune collezioni storico-culturali contengono un numero enorme di immagini, ad esempio, in varie versioni, dimensioni e formati. Quali versioni necessitano di un PID e quali no? Alcune organizzazioni registrano handle locali per tutte le versioni di un oggetto e scelgono di registrare un DOI per l'accesso globale alla versione principale dello stesso oggetto.
- A quale livello è necessario registrare un identificatore persistente? A livello di articolo? A livello di collezione? O a una sorta di unità di livello superiore rispetto a una collezione?
- Quale meccanismo di registrazione è più adatto al tuo flusso di lavoro e alla tua organizzazione?
- Quale modello di costo è più appropriato per il tuo caso d'uso: il pagamento diretto a un'agenzia DOI rispetto al personale e alle risorse tecniche necessarie per gestire e mantenere un sistema handle, o ARK o un altro tipo di identificatore?
Il progetto UKRI Heritage PIDs ha prodotto un'eccellente guida PID Use Case Mapping, così come molte altre risorse utili. Consiglio vivamente di consultare la pagina delle risorse UKRI Heritage PIDs per ulteriori indicazioni!
Punti essenziali della discussion: PID vs URI vs URL
Nella discussione che ha fatto seguito a questa presentazione durante la tavola rotonda spagnola sui metadati di nuova generazione nei beni culturali, i partecipanti hanno notato che c'è la tendenza a usare termini come "PID", "URI" e "URL" in modo intercambiabile, quando, in realtà, non sono equivalenti. Sebbene i PID siano spesso espressi come URL/URI, gli URI e gli URL, da soli, non sono necessariamente PID. Ciò ha dato origine a un'importante osservazione sulla necessità di essere più specifici, accurati e intenzionali quando si parla di identificatori. Come ha detto un partecipante:
"Dovremmo fare un po' di distinzioni. Con questo non voglio dire che uno sia migliore o peggiore dell'altro, ma piuttosto che sono diversi. Potremmo parlare di un identificatore persistente e non parlare affatto di linked open data, oppure di identificatori persistenti che hanno ancora molto lavoro da fare dietro le quinte, in termini di fornitura di informazioni strutturate o di accesso ai dati. Esistono anche sistemi che forniscono l'accesso tramite URL a dati migliori, per qualità o quantità, rispetto a quelli forniti da alcune applicazioni di linked open data. Volevo solo fare questa distinzione, in modo che ci fosse ben chiara durante il prosieguo di questi dibattiti".
È possibile scaricare le diapositive della presentazione di Liz Krznarich qui: https://doi.org/10.5281/zenodo.5899151
Il seguente articolo è stato pubblicato originariamente su Hanging Together.