.

Persistente URIs voor werken, expressies, manifestaties en items

Collectiebeheerders staan voor de uitdaging om bestaande metadata conceptueel op te splitsen of verdelen over de vier RDA niveaus: Werk, Expressie, Manifestatie en Item. Bij voorkeur krijgen al die niveaus ook persistente linked data URIs. Is het in bestaande catalogiseersystemen mogelijk om ruimte te bieden voor beheer van Werken en Expressies, zonder aanpassing van deze systemen?

RDA, hoe zat het ook alweer?

Podiumkunst.net heeft gekozen voor het gebruik van de RDA-metadatastandaard. RDA staat voor Resource Description and Access. Deze standaard, afkomstig uit de bibliotheekwereld, is gebaseerd op het conceptuele model IFLA LRM (Library Reference Model). Kenmerkend voor LRM is dat het creatieve werken op verschillende abstractieniveaus beschouwt. Zo zijn verschillende vertalingen van een roman verschillende Expressions (expressies), maar ze behoren wel tot hetzelfde Work (werk). Verschillende uitgaven gebaseerd op dezelfde tekst behoren tot dezelfde expressie maar zijn wel verschillende Manifestations (manifestaties). Tot slot zal een manifestatie doorgaans uit meerdere Items (items /exemplaren) bestaan.

De waarde van deze gelaagdheid is dat die vaak goed aansluit bij de perspectieven die gebruikers – vaak impliciet – hanteren wanneer ze bijvoorbeeld een boek zoeken. Ook helpt het bij het verbinden van op linked data gebaseerde beschrijvingen.

Een uitdaging waar Podiumkunst.net aan werkt, is te komen tot richtlijnen, handvatten en voorbeelden voor het gebruik van RDA bij het beschrijven van podiumkunsten. Dit gebeurt vooral in de werkgroep ‘RDA applicatieprofiel’

Van bestaande metadata naar de RDA werken, expressies, manifestaties en items

Een uitdaging waar collectiebeheerders mee te maken zullen krijgen is dat bestaande metadata-beschrijvingen conceptueel vaak nog opgesplitst of verdeeld zullen moeten worden over de vier niveaus van beschrijving van RDA (werk, expressie, manifestatie en item). In lijn met de NDE-richtlijnen zullen dan aan die verschillende niveaus ook persistente linked data URIs toegekend moeten gaan worden. Is het in bestaande catalogiseersystemen ook mogelijk om ook ruimte te bieden voor beheer van werken en expressies, zonder dat deze systemen uitgebreid of omgebouwd moeten worden?

Bij de omzetting van de Muziekschatten-metadata naar RDA, waar we nu aan werken, is onze ervaring dat dit goed mogelijk is met het bestaande catalogiseersysteem én met de bestaande metadata. Dit kan dankzij de genormaliseerde titels die in de Muziekschatten-database al toegekend zijn. De combinatie van deze genormaliseerde titel met de genormaliseerde en unieke naam (of ingang) voor de maker levert samen een uniek identificerende ingang. In de ETL-software (Extract, Transform, Load) die gebruikt wordt om van een export van de brondata RDA linked data te maken, wordt deze unieke identificerende ingang benut om een URI voor het werk te maken. Hoewel strikt gezien niet per se nodig, wordt deze unieke ingang via een hashing-algoritme (we gebruiken md5sum) tot een abstracte werk-identifier gemaakt, die voor de consument van de URI los staat van enige inhoudelijke semantiek.

Zo ook voor expressies en manifestaties

Voor de expressies wordt bij Muziekschatten een vergelijkbare aanpak gevolgd, met het verschil dat er meer eigenschappen meegenomen moeten worden om een expressie uniek te kunnen identificeren. Zo is het bij een expressie bijvoorbeeld ook van belang mee te nemen wat het type van de inhoud is, in het beeld van Muziekschatten of het gaat om bladmuziek, of uitgevoerde muziek.

Hoe staat het tot slot met de URIs voor manifestaties (‘publicaties’) en de items daarvan? Hier is de situatie in de praktijk meestal eenvoudiger. Catalogiseersystemen bieden doorgaans al uniek identificerende identifiers op dit niveau. Deze systeemidentifiers zijn zo goed te gebruiken om URIs mee op te bouwen. Er zal dan wel een plan gemaakt moeten worden om de geproduceerde URIs persistent te maken. Immers, bij een eventuele toekomstige overgang naar een ander nieuw catalogiseersysteem zullen de bestaande systeemidentifiers vaak niet meegenomen worden. Een goede aanpak zou hier kunnen zijn om de met de systeemidentifiers gemaakte URIs op te nemen in de catalogus zodat deze bij de overgang naar het nieuwe systeem bekend blijven.

door René Voorburg