Vanuit de linked data-filosofie biedt SPARQL de mogelijkheid om bij een zoekvraag meerdere triples stores te bevragen en de resultaten daarvan te combineren. Dit federatieve zoeken zorgt voor een rijk zoekresultaat. Dat past bij dat wat Podiumkunst.net beoogt. De keerzijde van federatief zoeken is dat het traag werkt. Hoe gaat Podiumkunst.net daarmee om?
Voor het kunnen bevragen en doorzoeken van linked data is er een standaard zoektaal genaamd SPARQL (je spreekt het uit als ‘sparkul’). SPARQL, wat staat voor ‘SPARQL Protocol and RDF Query Language’, is ontworpen om de mogelijkheden van linked data maximaal te kunnen benutten. Juist vanuit die linked data-filosofie biedt SPARQL dan ook de mogelijkheid om bij een zoekvraag meerdere linked data-databases (zogenaamde triple stores) gelijktijdig te kunnen bevragen én de resultaten daarvan te combineren.
De kracht van dit zogenaamde ‘federatieve zoeken’ is soms uitermate indrukwekkend, omdat je bronnen van over de hele wereld kunt combineren tot een zeer rijk zoekresultaat. Federatief zoeken lijkt daarmee op het eerste gezicht ideaal voor de opzet van een dienstenplatform zoals Podiumkunst.net wil bieden. Een keerzijde van federatief zoeken is echter dat het dikwijls traag en soms ook wat minder betrouwbaar werkt, bijvoorbeeld omdat één van de bevraagde bronnen niet beschikbaar blijkt te zijn.
Een oplossing hiervoor zou kunnen zijn om de data van de bronhouders simpelweg te kopiëren naar het dienstenplatform. Die benadering van het maken van kopieën sluit echter niet aan bij de principes achter NDE (Netwerk Digitaal Erfgoed) en van DERA (Digitaal Erfgoed Referentie Architectuur).
Het caching-mechanisme
Podiumkunst.net heeft daarom een caching-mechanisme laten ontwikkelen dat enerzijds de problemen met federatief zoeken omzeilt maar anderzijds toch aansluit bij NDE en DERA. We noemen het de federatieve caching-laag. De caching-laag wordt op een geautomatiseerde wijze gevuld met die data die nodig is om de vragen die gesteld kunnen worden via de APIs van het dienstenplatform te kunnen beantwoorden.
Hierbij wordt aangehaakt op het NDE-datasetregister. Zo wordt bijvoorbeeld aan de hand van de wijzigingsdatum van de dataset bepaald of de caching-laag ververst moet worden. Het verversen van die data gebeurt dan weer met behulp van SPARQL-queries.
Meer weten over de federatieve caching-laag? Neem contact op met rdeboer@archixl.nl of rene@podiumkunst.net