Symbool voor linked data

Een introductie tot linked data in bibliotheken

Linked data helpt bibliotheken om gegevens beter te verbinden en toegankelijker te maken. Dit verbetert zoekmogelijkheden en laat gebruikers nieuwe bronnen ontdekken. Door bibliotheekmetadata om te zetten naar linked data, delen en integreren bibliotheken hun gegevens efficiënter met andere systemen. Dit versterkt hun rol in het wereldwijde kennisnetwerk en maakt bronnen online beter vindbaar voor eindgebruikers. OCLC ondersteunt bibliotheken bij deze transitie met technologie en expertise. In deze longread leer je waarom goede metadata belangrijker zijn dan ooit.

Het belang van deze transitie wordt steeds duidelijker. Door nauw samen te werken met bibliotheken wereldwijd, merken we dat sommige bibliotheekmedewerkers zich al verdiepen in het onderwerp, linked data-diensten testen en deelnemen aan lopend onderzoek. Maar we weten ook dat anderen nog veel vragen hebben. Naast technische onderwerpen vragen bibliotheekmedewerkers zich af hoe linked data hun huidige werk beïnvloedt. Om hen hierin te ondersteunen, rolt OCLC linked data-infrastructuur en -diensten uit die aansluiten bij de huidige situatie van bibliotheken en zinvolle verbeteringen bieden voor de uitdagingen waarmee ze worden geconfronteerd.

Wat is linked data?

In de eenvoudigste vorm gaat linked data over verbindingen. Het is een manier om data op het web te organiseren en te verbinden, zodat het gemakkelijk, automatisch en programmeerbaar gedeeld en gebruikt kan worden door verschillende systemen en diensten.

Voor een korte, meer technische introductie, scroll je naar het einde van deze post. Maar de superkorte versie is dat linked data simpelweg regels gestandaardiseerde HTML-code zijn die computers gebruiken om verschillende concepten via hun relaties met elkaar te verbinden.

Als je kijkt naar het "kennisvenster" in een Google-resultaat, zie je vaak informatie over een onderwerp uit veel bronnen. Die "infokaart" is gevuld met linked data van vele andere sites. Andere gerelateerde linked data-bronnen, zoals VIAF, Wikidata en DBpedia, worden al gebruikt om diensten te verbinden en nieuwe toepassingen te creëren.

Naarmate meer gerelateerde linked data online komt, zien we meer kansen voor extra bibliotheekgerichte toepassingen. Door de waardevolle, bibliotheekgerichte data die opgesloten zit in MARC-records op te splitsen en te publiceren met behulp van URIs (Uniform Resource Identifiers), bieden bibliotheekmedewerkers meer context voor informatie en bouwen ze rijke verbindingen op tussen bibliotheekbronnen, hun gemeenschappen en daarbuiten.

Hoe verschilt linked data? Is het beter?

Traditionele, vaste dataformaten—zoals MARC-records—hebben twee grote beperkingen. Het is moeilijk om bruikbare data van andere, niet-bibliotheekbronnen in bibliotheekprocessen te integreren en het is moeilijk voor potentiële gebruikers van bibliotheekinformatie om MARC-data in hun processen te integreren.

De eerste is een uitdaging omdat er veel informatiebronnen zijn die helpen bij het verbeteren van het zoekproces en het gebruik van bibliotheekmaterialen. De tweede is een gemiste kans, omdat bibliotheekmetadata wordt gecreëerd door catalogiseerders (in bibliotheken en bij OCLC) die tot de meest getalenteerde dataspecialisten ter wereld behoren. Veel andere industrieën en gebieden kunnen profiteren van het werk dat zij doen.

Linked data helpt beide uitdagingen aan te pakken. OCLC werkt bijvoorbeeld samen met organisaties om linked data van bibliotheken in hun diensten te integreren. Deze inspanningen maken bibliotheekmaterialen zichtbaarder op plaatsen waar mensen online zoeken. En er zijn kansen voor partners om hetzelfde in omgekeerde richting te doen, hun informatie in systemen en diensten te krijgen waar bibliotheekmedewerkers en gebruikers verbinding kunnen maken. Linked data maakt bijvoorbeeld het verbinden van werken in verschillende talen veel eenvoudiger, wat betekent dat uitgevers vragen in één taal kunnen doorverwijzen naar materialen die in andere talen beschikbaar zijn.

In beide gevallen helpt het om bibliotheekwerk te verbinden met het bredere web, waardoor bibliotheken worden gepromoot en de efficiëntie wordt verbeterd.

Wat gebeurt er met MARC?

MARC is een standaard voor het vastleggen en uitwisselen van bibliografische gegevens in een machine-leesbaar formaat. Als we kijken naar de geschiedenis van metadata, zien we een consistent patroon van bibliotheken die overstappen naar systemen en diensten die meer mensen in staat stellen ermee te werken op meer manieren:

  • Gesloten magazijnen waren de ultieme datafilter. Toen gebruikers bibliotheekmedewerkers moesten vragen om bronnen uit een gesloten ruimte te halen, was er geen kans op directe interactie
  • Door later zelf langs de kasten te lopen, konden gebruikers zelf met behulp van metadata op de kasten en materialen hun eigen keuzes maken. Bibliotheekmedewerkers gingen van datawachters naar gidsen.
  • Gecentraliseerde databases, zoals WorldCat, verbonden vervolgens bibliotheekcatalogi voor het gezamenlijk aanmaken en verbeteren van records en het aanbieden van nieuwe manieren om bronnen te ontdekken en interbibliothecair leenverkeer uit te voeren.
  • Online toegang tot bibliotheekdatabases, zoals WorldCat.org, betekende dat iedereen met toegang tot een webbrowser bibliotheekmetadata online kon vinden en gebruiken. Vroege OCLC-partnerschappen zorgden er ook voor dat bibliotheekdata—met wat extra werk—gedeeld werd in andere online bronnen.

Linked data is de volgende stap in deze evolutie. Tot nu toe richtten we ons primair op het toegankelijker maken van bibliotheekmetadata voor mensen. Nu brengen we bibliotheekdata naar buiten op een manier die toegankelijker is voor online diensten, programma's, machine learning-systemen en toepassingen van kunstmatige intelligentie (AI).

MARC blijft nog lang bij ons. Het duurde tenslotte ook bijna 50 jaar voordat veel bibliotheken volledig overstapten van gedrukte kaarten naar online catalogisering. Ons plan is om MARC-gebaseerde functies te blijven ondersteunen terwijl we actief krachtige linked data-tools en -middelen voor bibliotheken ontwikkelen.

Waarom zou ik me vandaag al druk maken om linked data?

Naarmate bibliotheken zich blijven richten op nieuwe manieren om de creatie en het delen van kennis te faciliteren, en naarmate het volume en de variëteit aan informatie toenemen, worden metadata en metadata-expertise belangrijker dan ooit. Wanneer we bibliotheekdata omzetten naar "linked data", maken we het makkelijker om die informatie te verbinden met andere informatie op het internet. Dit betekent dat we bibliotheekboeken en -informatie beter kunnen koppelen aan andere bronnen die je dagelijks gebruikt, zoals websites, slimme apparaten en kunstmatige intelligentie (AI). Het maakt de kennis in bibliotheken toegankelijker en nuttiger in de digitale wereld. Iets waar de eindgebruiker van profiteert.

Hier zijn enkele redenen waarom je enthousiast zou moeten zijn over wat er vandaag gebeurt met linked data:

  • Het benut de collectieve expertise van bibliotheekmedewerkers bij duizenden instellingen. Dat biedt kansen voor nieuwe partnerschappen, origineel onderzoek en betere vindbaarheid voor de eindgebruiker.
  • Het synchroniseert en verbetert bibliotheekdata op schaal. WorldCat Entities is een set gecentraliseerde data die de context biedt voor bibliografische metadata-curatie. We verbinden het met bestaande systemen om linked data te integreren in andere bibliotheekprocessen.
  • Het helpt huidige systemen en workflows door de overgang naar linked data te integreren, zoals WorldCat Entities URIs in WorldCat.
  • We creëren nieuwe tools waarmee catalogiseerders linked data toevoegen aan bestaande records. Dit maakt verbeterde catalogiseringstoepassingen mogelijk, recordoutput met identificatoren en OCLC Meridian, een linked data-beheertool voor WorldCat Entities.
  • We lanceren ook een bibliografische bewerkingstool die naadloos werkt tussen BIBFRAME en MARC-data, om te voldoen aan de behoeften van bibliotheekmedewerkers tijdens hun overgang naar niet-MARC-formaten.

Er is veel om enthousiast over te zijn. En dit wordt een marathon, geen sprint. Maar voor vandaag? Weet dat OCLC werkt aan een linked data-toekomst die alle bibliotheken ondersteunt terwijl ze in hun eigen tempo en op manieren die waarde bieden zonder de huidige processen te verstoren, overstappen.

Klaar voor meer?

Blijf lezen om meer te leren over linked data. In deel 2 lees je hoe linked data bibliotheken helpt meer impact online te maken.


Ga naar deel 2 »

Technische achtergrond voor linked data

Toen Tim Berners-Lee en het team bij CERN in 1989 de basisprotocollen voor het web uitvonden, stelden ze drie basistechnologieën voor om mensen met bronnen te verbinden:

  • Unieke resource-identificatoren (URIs) voor alles wat op het web verbonden kan worden; URL's (Uniform Resource Locators)—beter bekend als "webpaginanamen"—zijn een type URI
  • De Hypertext Markup Language (HTML)-code die wordt gebruikt om documenten op het web te formatteren
  • Het Hypertext Transfer Protocol (HTTP), dat wordt gebruikt om verbindingen tot stand te brengen tussen webpagina's en gerelateerde middelen (afbeeldingen, geluid, video, apps en data)

Wanneer jij—een menselijke gebruiker van het web—klikt op een link die bijvoorbeeld zegt "Artistiek Archief", verwacht je dat het je naar een andere pagina met gerelateerde informatie brengt. De context voor die reis is gebaseerd op hoe mensen documenten en links gebruiken om gerelateerde bronnen te vinden en te openen.

Later breidde Berners-Lee dit uit door principes te schetsen om data tussen computers in plaats van mensen te verbinden. Hij stelde voor dat "conceptuele dingen" een URI moeten hebben voor een online naam die data over dat ding in een standaardformaat teruggeeft, en dat andere gerelateerde dingen ook een URI zouden moeten krijgen. Op deze manier kunnen computerprogramma's, net zoals mensen links gebruiken, van pagina naar pagina (URI naar URI) gaan, gebruikmakend van gemeenschappelijke technologie om gerelateerde informatie te zoeken en te gebruiken.

De URI voor een "ding" (vaak een "entiteit" genoemd, wat elk object, persoon, datum, concept, plaats, enzovoorts kan zijn) is gewoon een webpagina met linked data-code erop. Die code bevat informatie over het onderwerp en linkt ook naar andere entiteiten met behulp van iets dat een "triple" wordt genoemd, wat simpelweg is:

[Entiteit 1] <heeft een relatie> met [Entiteit 2]

Bijvoorbeeld:

[Annie M.G. Schmidt] <is de auteur van> [Jip en Janneke]

Die informatie zou te vinden zijn in een regel code op de pagina voor zowel Schmidt als het boek. Dus wanneer een computerprogramma een van beide pagina's vindt, "kent" het de relatie tussen die twee entiteiten. En wanneer miljarden stukjes linked data overal op het web worden gepubliceerd en verbonden, wordt het mogelijk om toepassingen te bouwen die voorheen niet-verbonden informatie op unieke en krachtige manieren gebruiken.

Bijvoorbeeld, een andere site zou linked data kunnen publiceren over waar beroemde mensen zijn geboren, en zou de volgende triple op de pagina voor Kapelle in Zeeland in Nederland kunnen hebben:

[Kapelle, Zeeland, Nederland] <is de geboorteplaats van> [Annie M.G. Schmidt]

En een derde toepassing zou data van veel sites kunnen halen om interessante reisgerelateerde informatie voor vakantieplanning weer te geven. De dienst zou linked data van de geboorteplaats-site kunnen halen en vervolgens zoeken naar gerelateerde, interessante links. Dus wanneer je de software gebruikt om een vakantie in Zeeland te plannen, zou het die linked data doorzoeken, die vervolgens verbinding maakt met bibliotheekdata, en bibliotheeklinks naar werken van auteurs uit die stad bieden.

Het belangrijkste om te onthouden is dat linked data simpelweg computercode is op gewone webpagina's die contextuele informatie over dingen ("entiteiten") biedt. Die data wordt vervolgens gelezen door geautomatiseerde programma's die het samenvoegen met linked data van andere bronnen om nieuwe toepassingen en diensten te creëren.