Evaluatie SKOS linked data standaarden

Content

Vergadering: Forum Standaardisatie 13 december 2023

Agendapunt: 3B3

Documentnummer: FS-20231213.3B3

Download hier de PDF versie van dit vergaderstuk. Wij kunnen de digitale toegankelijkheid van het PDF bestand niet garanderen.

Rechten: CC0 publieke domein verklaring

 

Domein ‘openbaar en toegankelijk’
Evaluatie SKOS en Linked Data standaarden

InnoValor Advies

Colofon

Projectnaam Evaluatie standaarden 2023: SKOS en Linked Data standaarden

Auteurs M. Roelfsema (InnoValor Advies)

K. de Jong (InnoValor Advies)

Opdrachtgever Forum Standaardisatie

Postbus 96810 2509 JE Den Haag

info@forumstandaardisatie.nl

Forum Standaardisatie

Creative commons Dit document verschijnt onder de Creative Commons licentie: CC0 1.0 Universeel (CC0 1.0)

Publiek Domein Verklaring

 

Inhoudsopgave

Managementsamenvatting
Bevindingen en aanbevelingen SKOS standaard
Bevindingen en aanbevelingen Linked Data standaarden

  1. Inleiding
    • Achtergrond
    • Aanleiding
    • Aanpak
    • Leeswijzer
  2. Evaluatie SKOS
    • Toelichting SKOS standaard
    • Evaluatie van SKOS
    • Conclusies en aanbevelingen SKOS
  3. Evaluatie Linked Data standaarden
    • Een semantische discussie over de term Linked Data standaarden
    • Linked Data in het algemeen
    • Linked Data toegepast
    • Het cluster Linked Data standaarden
    • Conclusies en aanbevelingen

Managementsamenvatting

De SKOS standaard staat sinds 2015 op de Nederlandse ‘pas toe of leg uit’-lijst. SKOS draagt bij aan een interoperabele overheid doordat de gebruiker duidelijke en deelbare begrippenlijsten kan opstellen waardoor gegevens vanuit verschillende databases aan elkaar gekoppeld kunnen worden, ook over organisatiegrenzen heen. Zo krijgen gegevens meer waarde.

Dit onderzoek evalueert de SKOS op de ´pas toe of leg uit’-lijst van Forum Standaardisatie. De evaluatie van SKOS biedt de mogelijkheid om tevens te onderzoeken wat de meerwaarde is van het clusteren van SKOS en aanpalende Linked Data standaarden in één registratie op de lijst open standaarden.

Bevindingen en aanbevelingen SKOS standaard

Uit het onderzoek naar SKOS komen de volgende bevindingen naar voren:

  • Het functioneel toepassingsgebied is op de ‘pas toe of leg uit’-lijst correct geformuleerd. Het is echter volgens een aantal experts complex geformuleerd waardoor het niet voor iedereen begrijpelijk kan zijn.
  • De toegevoegde waarde van SKOS voor de digitale overheid staat niet ter
  • Bij de experts bestaat veel draagvlak voor de standaard op de ‘pas toe of leg uit’-lijst. De adoptie van de standaard neemt toe gezien een toenemende behoefte aan de harmonisatie van taal: wanneer spreekt men over hetzelfde en wanneer over andere zaken.
  • De standaard wordt internationaal beheerd door W3C. De wijziging in de organisatie van W3C in 2023 heeft vooralsnog geen impact op de openheid van de standaardisatieprocessen en standaarden. In Nederland is er bij de overheid geen organisatie die regie voert op het gebruik van SKOS bij de overheid door kennis en ervaring te bundelen, de adoptie te monitoren en gebruikerseisen naar W3C terug te koppelen. Voor de hand liggende partijen zoals Platform Linked Data Nederland (PLDN) of de Vrije Universiteit hebben vooralsnog deze rol niet op zich genomen. Het invullen van de rol is van belang omdat de standaard relevant is voor overheidsorganisaties die inzetten op semantiek en de harmonisatie van taal: wanneer spreekt men over hetzelfde en wanneer over andere zaken.
  • Alle bevraagde experts beamen dat opname van de standaard op de ‘pas toe of leg uit’-lijst meerwaarde heeft.
  • Toen SKOS in 2015 op de 'pas toe of leg uit' lijst kwam, gaven de experts een aantal adviezen mee om de adoptie te Er is invulling gegeven aan de meeste adoptie-adviezen. PLDN speelt hier een belangrijke rol, in de breedte van de Linked Data standaarden, door kennis te verspreiden.
  • Er zijn verschillende ontwikkelingen van invloed op (adoptie van) de Al deze ontwikkelingen, zowel Europees als Nederlandse, leiden tot een verwachtte toename van het gebruik van begrippenlijsten. Standaardisatie daarin blijft relevant.

De onderzoekers van InnoValor Advies die deze evaluatie voor SKOS uitvoerden, komen op basis van het uitgevoerde onderzoek tot de volgende adviezen aan het Forum Standaardisatie:

  1. Herformuleer het toepassingsgebied (indien nodig, via een procedure) zodat dit ook begrijpelijk is voor zij die niet bekend zijn met Linked Data, ontologieën of

thesauri. Doe dit zo dat de betekenis van het toepassingsgebied niet veranderd wordt.

  1. Onderzoek of er een Nederlandse partij is die een regierol kan nemen rondom SKOS. Ga daarbij in ieder geval in gesprek met PLDN en Geonovum. Deze aanbeveling zou tegelijk opgepakt kunnen worden met de aanbeveling voor de regierol rondom het cluster aan Linked Data standaarden.

Zodra de regierol van de SKOS standaard belegd is binnen de Nederlandse overheid, zijn de volgende aanbevelingen gericht aan de partij die de regierol op zich neemt:

  1. Bepaal in hoeverre er nieuwe of aanvullende adoptieadviezen nodig zijn om de adoptie van SKOS te stimuleren, met name in het licht van de groeiende vraag bij bestuurders om semantiek en harmonisatie van taal: wanneer spreekt men over hetzelfde en wanneer over andere zaken.

Bevindingen en aanbevelingen Linked Data standaarden

De conclusie van dit onderzoek naar het al dan niet clusteren van de Linked Data standaarden (RDF, RDFS, OWL, SHACL, SPARQL en SKOS) op de lijst open standaarden is dat er meerwaarde zit in het clusteren van deze standaarden. Er is echter geen voor de hand liggende manier om de standaarden te clusteren. Welke standaarden relevant zijn is afhankelijk van de context of use case; niet elke context of use case vraagt om dezelfde set verplichte of aanbevolen standaarden.

De toegevoegde waarde, het draagvlak en het beheer van de Linked Data staan niet ter discussie. Er zijn wat aandachtspunten, bijvoorbeeld de ontbrekende invulling voor de Nederlandse regierol (een stimulerende rol met betrekking tot adoptie, betrokkenheid bij de internationale beheerorganisatie en inzet op kennisverspreiding en kennisuitwisseling). Het invullen van de rol is van belang omdat Linked Data standaarden relevant zijn in, en zich verder ontwikkelen in samenhang met, lopende ontwikkelingen (Joinup op Europees vlak, het federatief datastelsel in Nederland). De wijziging in de organisatie van W3C in 2023 heeft vooralsnog geen impact op de openheid van de standaardisatieprocessen en standaarden.

De ontwikkelingen tonen aan dat Linked Data meer en meer relevant gaan worden, met name daar waar data integratie van belang is. Europese ontwikkelingen kunnen een drijvende kracht worden in het gebruik van Linked Data standaarden en technieken.

De uitdagingen tonen aan dat het Linked Data veld in ontwikkeling is. Met steeds meer implementaties van Linked Data toepassingen ontstaat er vraag naar volwassen marktpartijen, mensen met Linked Data kennis, en de uitrol van Linked Data toepassingen in reguliere bedrijfsprocessen. De grootste uitdaging zit in het breed inzetten op Linked Data, om Linked Data te kunnen gebruiken in dienstverlening moet het legitimiteit krijgen vanuit de top van de Nederlandse overheid.

De onderzoekers van InnoValor Advies die het onderzoek naar de Linked Data standaarden uitvoerden, komen op basis van het uitgevoerde onderzoek tot de volgende adviezen aan het Forum Standaardisatie

  1. De Linked Data standaarden zijn te verbinden aan de FAIR Het heeft betrekking op het vindbaar (Findable), toegankelijk (Accessible), interoperabel (Interoperable) en herbruikbaar (Reusable) maken van gegevens. Het advies is om te bepalen in hoeverre andersoortige standaarden (principes of richtlijnen), zoals de FAIR principes, een plek kunnen krijgen op de lijsten van het Forum Standaardisatie.
  2. Het clusteren van Linked Data standaarden op de lijst open standaarden heeft als gevolg dat er gelaagdheid in het toepassingsgebied ontstaat. Er is een toepassingsgebied voor het cluster als het geheel en toepassingsgebieden voor de standaarden binnen het cluster. Het advies is om te bepalen hoe de gelaagdheid van het toepassingsgebied van het cluster aan Linked Data standaarden vormgegeven kan worden op de lijst open standaarden.
  3. In gesprek gaan met Geonovum, Vrije Universiteit en PLDN over hoe de regierol op de Linked Data standaarden het beste ingevuld kan worden.
  4. De veranderingen omtrent de organisatie van het W3C zouden impact kunnen hebben voor de financiering en openheid van de Dit geldt voor meer standaarden dan de Linked Data standaarden. Het advies is om te onderzoeken wat de impact van de veranderingen bij W3C is op de open standaardisatie criteria.

Zodra de regierol van SKOS belegd is binnen de Nederlandse overheid, zijn de volgende aanbevelingen gericht aan de partij die de regierol op zich neemt:

  1. Bepaal samen met een afvaardiging van de Linked Data community welke standaarden in de basisset thuis horen.
  2. Verken samen met het Bureau van het Forum Standaardisatie de aanmelding van de Linked Data standaarden als cluster voor op de lijst van het Forum standaardisatie, inclusief de SPARQL standaard die nu nog niet op de lijsten van het Forum Standaardisatie staat. Bepaal, in het kader van de verkenning, samen met een afvaardiging van de Linked Data community onder welke gemeenschappelijke noemer een dergelijk cluster het beste op de lijst open standaarden kan worden aangeduid.

1. Inleiding

1.1. Achtergrond

Forum Standaardisatie is een onafhankelijke overheidsorganisatie die de overheid adviseert over het gebruik van open ICT standaarden in de digitale overheid. Open standaarden zorgen voor een betere uitwisselbaarheid en toegankelijkheid van gegevens. Forum Standaardisatie zorgt ervoor dat digitale gegevens veiliger en gemakkelijker met elkaar uitgewisseld kunnen worden. Zo helpen zij de samenwerking binnen de publieke sector te verbeteren. In opdracht van het Forum Standaardisatie voert Bureau Forum Standaardisatie (BFS) initiatieven uit om het gebruik van open standaarden bij de overheid te bevorderen.

Een van de manieren van Forum Standaardisatie om de onderlinge samenwerking van overheden te bevorderen is door open standaarden te toetsen en voor te schrijven aan publieke organisaties. Op de ‘pas toe of leg uit’-lijst (verplichte standaarden) van het Forum Standaardisatie staan standaarden die overheden verplicht moeten toepassen volgens ‘pas toe of leg uit’-verplichting op het moment dat ze een ICT-dienst of -product aanschaffen dat binnen het desbetreffende toepassingsgebied valt van de standaard.

De ‘pas toe of leg uit’-lijst wordt onderhouden op basis van een open procedure. De toetsing bij aanmelding is een momentopname. Als een standaard een aantal jaar op de ‘pas toe of leg uit’-lijst staat, kan het zijn dat de relevantie, het draagvlak, het toepassingsgebied of de marktpartijen veranderd zijn. Er kunnen dan vragen ontstaan als: Heeft de standaard nog toegevoegde waarde? Wordt de standaard nog door voldoende marktpartijen ondersteund?

In zulke gevallen kan het Forum Standaardisatie besluiten om standaarden te evalueren. Dit gaat dan om standaarden die langer dan vier jaar of langer op de lijst ‘pas toe of leg uit’-lijst staan. Voor 2023 evalueert het Forum Standaardisatie Simple Knowledge Organization System (SKOS) als standaard op de ‘pas toe of leg uit’-lijst en aanpalende Linked Data standaarden op de lijst Aanbevolen Standaarden als cluster.

SKOS draagt bij aan een interoperabele overheid doordat de gebruiker duidelijke en deelbare begrippenlijsten kan opstellen waardoor informatie vanuit verschillende databases aan elkaar gekoppeld kunnen worden, ook over organisatiegrenzen heen. SKOS is een gegevensmodel om duidelijke lijsten met termen en begrippen op te stellen. Met deze termenlijsten kan informatie uit verschillende databases aan elkaar worden gekoppeld. SKOS maakt de relaties tussen begrippen inzichtelijk voor het vergelijken en interpreteren van data uit verschillende systemen. Zo krijgt informatie meer waarde.

De aanpalende Linked Data standaarden uit de Lijst Aanbevolen Standaarden zijn::

  • OWL (Web Ontology Language): beschrijvingstaal semantisch web
  • RDF (Resource Description Framework): publicatie gestructureerde gegevens
  • RDFa (Resource Description Framework in Attributes): indexeren en verzamelen van geautomatiseerde content
  • RDFS (Resource Description Framework Schema): standaardtaal voor structuur van gegevens in termen van klassen, eigenschappen en datatypen
  • SHACL (Shapes Constraint Language): kwaliteitscriteria op Linked Data

De evaluatie brengt de samenhang van de Linked Data standaarden in beeld. Dit draagt bij aan duiding van de standaarden op maatschappelijke meerwaarde.

1.2. Aanleiding

Het Forum Standaardisatie heeft de opdracht gegeven om de SKOS standaard te evalueren. In het Forumadvies d.d. 10 april 2015 is opgenomen dat ten aanzien van de adoptieadviezen de opgeroepen partijen worden gevraagd om één jaar na opname van de standaard over de voortgang van deze punten te rapporten aan het Forum Standaardisatie. Deze evaluatie van SKOS (en aanpalende Linked Data standaarden) onderzoekt onder andere in hoeverre de adoptieadviezen inmiddels zijn opgevolgd.

Binnen de overheid groeit (de wens naar) het gebruik van semantische standaardisatie. Linked data standaarden, waaronder SKOS, dragen bij aan de semantische standaardisatie. De community betrokken bij Linked Data heeft gesignaleerd dat het meerwaarde heeft om de Linked Data standaarden te clusteren in één registratie op de lijst open standaarden (vergelijkbaar met de registratie van Geo-standaarden op de ’pas toe of leg uit’-lijst). SKOS staat op de ‘pas toe of leg uit’-lijst. De evaluatie van SKOS biedt de mogelijkheid om tevens te onderzoeken wat de meerwaarde is van het clusteren van SKOS en aanpalende Linked Data standaarden in één registratie.

Bijzonder aandachtspunt in de onderzoeken is of een Nederlandse partij zich over de adoptie van SKOS in de Nederlandse publieke sector ontfermt. De standaard vraagt om een regierol, die de volgende aspecten omvat:

  • Een stimulerende rol met betrekking tot adoptie;
  • Betrokkenheid bij de internationale beheerorganisatie vanuit Nederlandse belangen;
  • Inzet op kennisverspreiding en kennisuitwisseling rond de

Voor meer informatie over de regierol wordt verwezen naar paragraaf 3.3 uit het Beheeren Ontwikkelmodel Open Standaarden (BOMOS) deel 2.

1.3. Aanpak

Bij de uitvoering van de evaluatie is de volgende aanpak gehanteerd:

  • Kick-off bijeenkomst: vaststelling van de scope en aanpak van het onderzoek, en de te interviewen experts (Bureau Forum Standaardisatie en InnoValor Advies)
  • Bureau-onderzoek: verkenning naar beschikbaar materiaal over gebruik, beheer en toepassing van de standaard. Gericht op zowel een eerste inhoudelijke indicatie, als op verkenning van relevante partijen.
  • Interviews: met vertegenwoordigers van beheerder, gebruikers, en leveranciers (samen: experts) die in hun werk met de standaard te maken hebben. De evaluatiecriteria zijn hierbij als leidraad gebruikt.

Op basis van de tweede stap is er contact gezocht met de experts voor semigestructureerde interviews. De resultaten zijn verwerkt in dit rapport. De uitwerking van de evaluatie is in twee rondes gedeeld met dossierhouders en opdrachtgever ter review.

Na review is er besloten om aanvullende interviews te houden om extra verdieping te geven daar waar nodig.

1.3.1. Betrokken experts evaluatie

De volgende experts zijn betrokken geweest bij het onderzoek:

Voornaam Achternaam Organisatie
Danny Greefhorst ArchiXL
Jan Willem van Veen ArchiXL
Gerald Groot Roessink DUO
Linda van den Brink Geonovum
Erwin Folmer Kadaster / Universiteit Twente
Jesse Bakker Kadaster
Arjen Santema Kadaster
Marc van Opijnen KOOP
Marcel Krassenburg MKidee
Enno Meijers Netwerk Digitaal Erfgoed
Pieter van Everdingen Platform Linked Data Nederland / OpenInc
Jan Voskuil Platform Linked Data Nederland / Taxonic
Frank van Harmelen Vrije Universiteit Amsterdam

Tabel 1 - Betrokken experts evaluatie

De onderzoekers hebben daarnaast Marco Brattinga van Ordina benaderd voor extra verdieping.

1.3.2. Evaluatiecriteria

De evaluatie van SKOS heeft plaatsgevonden op basis van de onderstaande criteria. De evaluatie van de Linked Data standaarden heeft zich gebaseerd op enkele van de onderstaande criteria en daarnaast op de samenhang tussen de standaarden. De criteria zijn als volgt:

  1. Is het functioneel toepassingsgebied nog juist? Is dit duidelijk en concreet geformuleerd? Weet een potentiële gebruiker wanneer de standaard van toepassing is?
  2. De toegevoegde waarde van de Heeft de standaard nog toegevoegde waarde? Welk reëel en als zodanig ervaren probleem heeft de standaard opgelost?
  3. Is er nog voldoende draagvlak voor de standaard? Hoe staat het met gebruik van de standaard, waar wordt deze toegepast binnen de overheid en wat zijn de toekomstige ontwikkelingen? Zijn er voldoende marktpartijen die de standaard ondersteunen?
  4. Voldoet het beheer en doorontwikkeling aan de vereiste criteria? Zijn er zaken veranderd in het beheer van de standaard sinds de plaatsing op de ‘Pas toe of leg uit’-lijst? Voldoet het beheer van de standaard nog aan de criteria voor openheid en is het besluitvormingsproces nog goed en actueel gedocumenteerd? Is de beheerder van de standaard nog actief?
  5. Heeft opname op de lijst de adoptie bevorderd? Ondersteunen de experts de opname van de standaard op de ‘Pas toe of leg uit’-lijst? Wat zijn eventuele redenen om dit niet te ondersteunen? Wat zijn redenen om de standaard wel op de lijst te houden?
  6. Zijn de adoptie adviezen opgevolgd? Bij verschillende standaarden zijn opname- adviezen meegegeven door het Forum om de adoptie te bevorderen. Zijn deze adviezen opgevolgd en/of zijn er nieuwe adoptie adviezen mee te geven?
  7. Zijn er relevante lopende ontwikkelingen? Wat zijn de toekomstige ontwikkelingen met betrekking tot de standaard (of gerelateerde standaarden) en het interoperabiliteitsprobleem dat de standaard oplost? Heeft dit impact voor de positie van de standaard op de lijst? Zijn er nieuwe versies nieuwe standaarden op komst, is er een noodzaak tot verplicht gebruik hiervan, en is deze mogelijk geschikt voor opname op de lijst?

1.4. Leeswijzer

De evaluaties van SKOS en de Linked Data standaarden zijn in een document samengebracht. Hoofdstuk 1 biedt achtergrond, een toelichting, het doel en de aanpak van beide evaluaties. Hoofdstuk 2 toont de evaluatie van SKOS met de bijbehorende conclusies en aanbevelingen. Hoofdstuk 3 geeft de evaluatie van Linked Data standaarden weer. Hoofdstuk 3 geeft tevens een algemene conclusie aan aanbevelingen die betrekking hebben op de Linked Data standaarden.

2. Evaluatie SKOS

2.1. Toelichting SKOS standaard

SKOS zorgt ervoor dat een kennisorganisatiesysteem (knowledge organization system) (denk aan thesauri, classificatieschema’s en taxonomieën) machine readable en interoperabel is te publiceren. Zo kunnen gegevensbestanden aan elkaar gekoppeld worden, kunnen gegevens verrijkt worden met gegevens uit andere bronnen, en kunnen zoekopdrachten over gegevensbestanden heen gedaan worden. Dit bevordert uiteindelijk interoperabiliteit over organisatiegrenzen heen. Het toepassen van de standaard draagt bij aan het eenduidig vastleggen van betekenis van begrippen en maakt de (familie)relaties tussen de verschillende definities van begrippen beter inzichtelijk. Met SKOS zijn data uit verschillende systemen zodoende beter te vergelijken en te interpreteren. De diverse definities zijn dan eenvoudig naast elkaar te leggen.

Door de manier waarop de SKOS standaard ingericht is kunnen nieuwe versies van bestaande begrippenlijsten (KOS) worden gepubliceerd zonder dat de links (URI/IRI) tussen de termen daardoor onbruikbaar worden. SKOS wordt gebruikt voor onder andere begrippenlijsten, taxonomieën en thesauri. Ook kan een SKOS model gedeeld worden in een machine readable formaat op het Web.

SKOS is gebaseerd op de Linked Data-standaarden RDF, RDFS en OWL. Linked data is een methode om gestructureerde gegevens te publiceren op het internet en met andere gegevens (data) te verbinden (linken). Hierdoor worden verbanden tussen verschillende open databronnen zichtbaar. Deze samenhang maakt het mogelijk om relevante informatie te vinden, te structureren en te koppelen. Ten opzichte van OWL maakt SKOS het mogelijk om op een informelere manier concepten en relaties te beschrijven. Twee begrippen hoeven niet per se hetzelfde te zijn, maar kunnen met SKOS ook gedefinieerd worden als gerelateerd aan elkaar. Een uitgebreide beschrijving van de verschillende Linked Data standaarden en hun onderlinge verhoudingen wordt gegeven in hoofdstuk 3.

2.2. Evaluatie van SKOS

Uit de evaluatie blijkt dat de opname van SKOS op de ‘pas toe of leg uit’-lijst niet ter discussie staat onder de experts. Het gedefinieerde toepassingsgebied is correct, maar te ingewikkeld geformuleerd. Er wordt geadviseerd dit te herformuleren zodat het beter te begrijpen is voor zij die niet bekend zijn met Linked Data, thesauri of kennisrepresentatie.

De adoptie van SKOS kent veel verschil tussen overheidssectoren. Hierbij springen de rijksoverheden, uitvoeringsorganisaties, waterschappen en de erfgoedsector er positief uit. De adoptie neemt de laatste jaren sterk toe. Het gebruik van SKOS door overheidsorganisaties zou beter inzichtelijk gemaakt kunnen worden door deze begrippenlijsten op een centrale plek te publiceren, vergelijkbaar met data.overheid.nl.

Het ontbreekt aan een partij die een nationale regierol op zich neemt voor SKOS. Wel vervult Platform Linked Data Nederland (PLDN) nu al een belangrijke kennis- en netwerkrol voor Linked Data standaarden inclusief SKOS.

2.2.1. Toepassingsgebied

SKOS kent het volgende functioneel toepassingsgebied:

SKOS moet worden toegepast op de publicatie van niet-geformaliseerde systemen voor kennisrepresentatie op het internet, met als doel:

1. kennis over de betekenissen en samenhang van de onderliggende begrippen te ordenen en toegankelijk te maken

2. hergebruik mogelijk te maken.

 

Alle bevraagde experts beamen dat het gedefinieerde toepassingsgebied formeel correct is. Circa de helft van experts geeft uit zichzelf aan dat het ingewikkeld te begrijpen is voor iemand die niet bekend is met Linked Data, thesauri of kennisrepresentatie. Het toepassingsgebied is niet helder geformuleerd.

2.2.2. Toegevoegde waarde

Toegevoegde waarde SKOS staat niet ter discussie

Alle bevraagde experts zijn het erover eens dat de standaard SKOS een duidelijke meerwaarde heeft. SKOS helpt organisaties om definities aan hun begrippen en data te geven. Door het gebruik van SKOS worden data machine readable en interoperabel. Zo kunnen gegevensbestanden aan elkaar gekoppeld worden en kunnen zoekopdrachten over gegevensbestanden heen gedaan worden. Dit bevordert uiteindelijk interoperabiliteit over organisatiegrenzen heen. Het toepassen van de standaard draagt bij aan het eenduidig vastleggen van betekenis van begrippen en maakt de (familie)relaties tussen de verschillende definities van begrippen beter inzichtelijk. Met SKOS zijn data uit verschillende systemen zodoende beter te vergelijken en te interpreteren. Daarnaast zijn er ook standaarden op ‘pas toe of leg uit’-lijst die op hun beurt weer gebruik maken van SKOS, zoals GWSW voor stedelijk waterbeheer of Aquo- standaard voor watermanagement.

Inmiddels zien sommige experts dat men bij andere toepassingen, zoals het ontwikkelen van een metamodel met de standaard MIM, begint met het ontwikkelen van een vocabulaire in SKOS. Ook binnen (grotere) organisaties kan SKOS helpen data tussen verschillende afdelingen uitwisselbaar te maken. SKOS is daarmee tevens voor interne data integratie relevant.

Een aantal experts geeft aan dat beginnen met SKOS relatief laagdrempelig is en zelfs zonder het toepassen van andere Linked Data standaarden van meerwaarde is om bovenstaande redenen. Een uitgebreide beschrijving van de verschillende Linked Data standaarden en hun onderlinge verhoudingen wordt gegeven in hoofdstuk 3.

2.2.3. Draagvlak

Draagvlak voor SKOS staat niet ter discussie.

Uit de interviews blijkt dat het gebruik van SKOS niet ter discussie staat. De experts geven aan dat een centraal overzicht van alle SKOS toepassingen door de overheid niet bestaat, maar wel via verschillende losstaande overzichten inzichtelijk te maken is.

Voorbeelden hiervan zijn BegrippenXL,Triply en Linked Open Vocabulaires (LOV). Hiernaast hebben sommige overheidsdomeinen een eigen initiatief zoals het Termennetwerk in de erfgoed sector.

Experts geven ondanks een gebrek aan concrete cijfers aan dat zij het beeld hebben dat de adoptie sinds opname op de ‘pas toe of leg uit’-lijst wel toegenomen is. Hetzelfde beeld komt naar voren uit de Monitor Open Standaarden 2022. Het aantal organisaties dat een begrippenlijst, woordenboek of taxonomie op het internet publiceert is toegenomen van 50% in 2021 naar 57% in 2022 (op basis van 51 overheidsorganisaties). Dit zijn de organisaties die SKOS moeten toepassen volgens ‘pas toe of leg uit’-lijst. Uit de monitor blijkt dat ongeveer 72% van de organisaties dit in 2022 daadwerkelijk deed.

Een vergelijkbaar beeld komt naar voren uit de Monitor 2023.

Een reden voor de toename in adoptie is dat er in Nederland een verandering gaande is in de afgelopen twee jaren op het gebied van traceerbaarheid en verantwoording bij overheidsorganisaties. Met name door de opkomst van Artificial Intelligence en incidenten zoals de Toeslagenaffaire is er een roep om een transparantere overheid. Hiermee is er een grotere behoefte in alle lagen van bestuur om grip te krijgen op de

informatiestromen. Een van de dingen die bijdraagt aan deze grip is de harmonisatie van taal; wanneer spreekt men over hetzelfde en wanneer over andere zaken. Bestuurders spreken niet over standaarden zoals SKOS maar wel over semantiek en harmonisatie van taal. Door deze omslag neemt het aantal overheidsorganisaties dat inzet op het opzetten van begrippenlijsten toe en zodoende wordt daar steeds vaker SKOS voor ingezet.

Adoptie op rijksniveau

Adoptie op rijksniveau is gegroeid. Uit de Monitor Open Standaarden blijkt dat vooral uitvoeringsorganisaties SKOS en andere Linked Data standaarden toepassen. Dit beeld wordt bevestigd door de experts. Voorbeelden van gepubliceerde thesauri zijn die van DUO en RDW.

Adoptie binnen de gemeenten

Uit de Monitor Open Standaarden blijkt dat de adoptie van SKOS onder gemeenten achterblijft. Dit werd ook in de interviews bevestigd. Een expert geeft aan dat de meeste gemeentes te klein zijn om zelf een eigen SKOS model te ontwikkelen. Gemeente overstijgende modellen liggen meer voor de hand. Een voorbeeld hiervan is VNGThesaurus. Het is niet inzichtelijk te maken hoeveel gemeentes hiervan gebruik maken.

Ook binnen ontwikkelingen zoals Common Ground of het Gemeentelijk Gegevensmodel(GGM) wordt momenteel geen gebruik gemaakt van SKOS. Het is wel de ambitie is om GGM uiteindelijk in lijn te brengen met SKOS.

Adoptie waterschappen en provincies

In de Monitor Open Standaarden 2022 wordt gesuggereerd dat adoptie bij waterschappen en provincies achterblijft. Meerdere experts geven echter aan dat de adoptie bij waterschappen en provincies is toegenomen sinds de opname op de ‘pas toe of leg uit’-lijst. Een beeld dat bevestigd wordt in de Monitor Open Standaarden 2023. Op BegrippenXL zijn vier modellen van provincies en drie van waterschappen gepubliceerd. Daarnaast zijn er nog vijf andere modellen rondom water, waaronder de Droogte thesaurus van Informatiehuis Water (IHW).

Adoptie semioverheid

Andere sectoren waar het gebruik van SKOS en andere Linked Data standaarden wijdverspreid is zijn onder andere de cultureel erfgoedsector, de medische sector en het geo-domein. Het Termennetwerk van Netwerk Digitaal Erfgoed is een voorbeeld van een succesvolle SKOS implementatie.

SKOS heeft draagvlak in het buitenland

Ook internationaal blijft SKOS een relevante standaard. Een aantal grote technologie providers, zoals Google en Amazon, gebruiken SKOS samen met andere Linked Data standaarden om het world wide web beter doorzoekbaar en interpreteerbaar te maken. Ook de Europese Unie maakt gebruik van SKOS, bijvoorbeeld voor het publiceren van door hun publication office. Andere voorbeelden zijn onder meer te vinden op de website van SKOSMOS, een open source SKOS browser.

Een uitgebreide beschrijving van internationaal gebruik van Linked Data, waaronder SKOS, is te vinden in paragraaf 3.3.

Marktondersteuning voor de standaard

De experts geven aan dat er voldoende marktpartijen zijn die kunnen helpen met het formuleren van een SKOS model en de implementatie daarvan. Er wordt aangegeven dat het aanbod in de afgelopen jaren is toegenomen. Hiernaast is er ook veel open source software beschikbaar. Dit geeft overheidsorganisaties de mogelijkheid SKOS zelf te implementeren, maar ook de marktpartijen maken hier gebruik van. BegrippenXL maakt bijvoorbeeld gebruik van de open source web-based SKOS browser SKOSMOS.

2.2.4. Beheer

Beheer van SKOS staat niet ter discussie.

Sinds de opname op de ‘pas toe of leg uit’-lijst zijn er geen grote wijzigingen in het beheer van SKOS. W3C is een bekende en stabiele beheerorganisatie. In 2023 heeft er weliswaar een belangrijke wijziging in de organisatie van W3C plaatsgevonden, maar deze heeft geen impact op de openheid van de standaardisatieprocessen en standaarden. De afgelopen jaren zijn er geen ontwikkelingen geweest binnen de standaard zelf en deze is zodoende als volwassen te beschouwen. Een uitgebreidere beschrijving over W3C als beheerorganisatie is te vinden in paragraaf 3.2.4.

W3C heeft als internationale beheerorganisatie geen specifieke ambities om het gebruik van SKOS bij de Nederlandse overheid te stimuleren. Hiernaast ontbreekt het in Nederland aan een partij die nationaal een kennisrol of stimulerende rol kan nemen.

Daarom is onderzocht of een nationale regierol aan een Nederlandse organisatie toegewezen kan worden. Het invullen van de rol is van belang omdat de standaard relevant is voor overheidsorganisaties die inzetten op semantiek en de harmonisatie van taal.

Het Platform Linked Data Nederland (PLDN) is een netwerk waar experts en belangstellenden kennis delen over Linked Data die het gebruik van SKOS en andere Linked Data standaarden stimuleert en kennis hierover verspreidt. PLDN is echter geen formele organisatie maar een platform die beperkt beschikking heeft over structurele financiering of middelen. Leden van de stuurgroep betalen jaarlijks een afdracht, er is echter geen sprake van een grote organisatie. Hierdoor is PLDN minder geschikt voor een regierol. De experts geven aan dat er geen andere voordehand liggende partijen zijn om een regierol op zich te nemen. Een enkeling geeft aan dat Geonovum een optie is.

Anderen geven aan dat door het generieke toepassingsgebied van SKOS het onwenselijk is deze regierol toe te wijzen aan een sectorspecifieke beheerorganisatie.

2.2.5. Opname op de lijst

Opname op de lijst van SKOS staat niet ter discussie.

Alle experts onderschrijven de meerwaarde van SKOS. De experts zijn van mening dat de standaard op de ‘pas toe of leg uit’-lijst gehandhaafd moet worden. Er is hoogstens discussie over de samenhang tussen SKOS en de andere Linked Data standaarden.

Enkele experts benadrukken dat SKOS afzonderlijk van andere Linked Data standaarden ingezet kan worden. Dit gebeurt regelmatig aangezien de standaard op zichzelf meerwaarde heeft in het opstellen van begrippenkaders. De opname op de ‘pas toe of leg uit’-lijst heeft ervoor gezorgd dat er meer wordt ingezet op het harmoniseren van begrippen. Dit is een positieve ontwikkeling.

De verhoudingen tussen de Linked Data standaarden worden nader toegelicht in paragraaf 3.2.2.

2.2.6. Status adoptie adviezen

Hieronder volgt er per adoptieadvies een statusupdate.

  Advies Status
1 Platform Linked Data Nederland wordt opgeroepen om de mogelijkheid en de behoefte te onderzoeken van een duurzaam register van alle publiek beschikbare KOS. Er is niet één centraal overheidsregister van publiek beschikbare KOS. Een dergelijk overheidsregister bestaat bijvoorbeeld wel voor open data. Wel heeft PLDN een overzicht met verwijzingen naar registers of lijsten waar Linked Data te vinden is.
2

Platform Linked Data Nederland wordt opgeroepen om aandacht te vragen voor SKOS via publicatie van artikelen in dagbladen /vakbladen/online/etc.

De opname op de lijst is een goed moment om dat samen met Bureau Forum Standaardisatie op te pakken.

Dit advies is impliciet ingevuld door de werkwijze die PLDN hanteert om het gebruik Linked Data standaarden waaronder SKOS te bevorderen. De community van PLDN is in de loop van de jaren gegroeid.
3 Platform Linked Data Nederland wordt opgeroepen om te toetsen of opname van SKOS in de NORA mogelijk is. SKOS is inmiddels opgenomen in de NORA.
4 Platform Linked Data Nederland wordt opgeroepen om trainingen te verzorgen die de implementatie en het gebruik van SKOS moeten bevorderen. Er is cursusmateriaal en er wordt door PLDN verwezen naar cursussen. Deze cursussen zijn niet specifiek voor SKOS, maar vaak gericht op Linked Data in de bredere zin
5 Platform Linked Data Nederland en Bureau Forum Standaardisatie worden opgeroepen om te kijken hoe de voortgang en de mate van adoptie inzichtelijk gemaakt kan worden. Buiten de Monitor Open Standaarden is hier geen verdere invulling aan gegeven.
6 Forum standaardisatie wordt opgeroepen om de relatie tot RDF op de lijst te verduidelijken. Er is een toelichting opgenomen op de pagina van SKOS over samenhang met de andere Linked Data standaarden.

Tabel 2 - Status adoptieadviezen

Tijdens de evaluatie bleek dat de adoptieadviezen redelijke mate zijn ingevuld. Uit de interviews bleek tevens dat slechts enkele experts op de hoogte waren van de adoptieadviezen en de status van de invulling daarvan.

2.2.7. Lopende ontwikkelingen

De SKOS standaard is al jaren onveranderd en is dus zeer stabiel. De relevante ontwikkelingen zitten vooral rondom het implementeren van SKOS en het ontwikkelen van SKOS profielen in plaats van ontwikkelingen in de SKOS-standaard zelf.

Er wordt momenteel door een groep gewerkt aan een Nederlandse standaard voor hetbeschrijven van begrippen (SBB). De SBB is een standaard gericht op het kunnen beschrijven van begrippen op eenzelfde manier waardoor begrippen deelbaar worden

tussen organisaties. De SBB heeft een duidelijke taalbinding met SKOS maar kan ook middels andere standaarden worden uitgedrukt. Bovendien gaat SBB verder dan de elementen in SKOS en heeft het onder andere ook betrekking op de relatie tussen begrippen en hun herkomst/bron. Zodoende is de SBB een op zich zelf staande standaard, vergelijkbaar met een standaard zoals MIM.

Er zijn generieke ontwikkelingen die de adoptie van Linked Data in het algemeen, en daarmee ook SKOS, raken. Deze worden uitgebreid toegelicht in paragraaf 3.3.2.

2.3. Conclusies en aanbevelingen SKOS

2.3.1. Conclusies SKOS

De experts concluderen dat er voldoende aanleiding is om SKOS op de ‘pas toe of leg uit’-lijst te handhaven. Omdat het aanbieden van begrippenlijsten steeds belangrijker wordt, is het organiseren van een Nederlandse regierol een wenselijke stap.

Toepassingsgebied

Het functioneel toepassingsgebied is formeel correct geformuleerd, maar is volgens een aantal experts onvoldoende concreet en helder voor iemand die geen kennis heeft van Linked Data of kennismanagement. Tegelijkertijd geven experts aan dat SKOS meerwaarde heeft binnen eigen organisatiegrenzen omdat het interne data integratie. Dit is niet terug te vinden in het huidige functioneel toepassingsgebied.

Toegevoegde waarde

De toegevoegde waarde van de SKOS-standaard op de ´pas toe of leg uit´-lijst voor de digitale overheid staat niet ter discussie onder de experts. Experts beargumenteren dat SKOS met name voor grote organisatie tevens meerwaarde heeft voor de interne data integratie.

Draagvlak

In een aantal werkingsgebieden zoals de Erfgoedsector en de Rijksoverheid is de adoptie van SKOS hoog en wordt vrijwel in alle toepassingen gebruikt waar de standaard verplicht is. In de breedte worden steeds meer SKOS begrippenlijsten gepubliceerd en er is toename van SKOS ten behoeve van interne bedrijfsprocessen (dat wil zeggen, zonder begrippenlijst, woordenboek of taxonomie op internet te publiceren). Vooral bij gemeenten blijft de adoptie achter. Het groeiende draagvlak en de groei in adoptie valt onder andere te herleiden naar een belang bij bestuurders om in te zetten op semantiek en de harmonisatie van taal: wanneer spreekt men over hetzelfde en wanneer over andere zaken.

Beheer

De standaard wordt actief beheerd door W3C en het beheerproces is open. De wijziging in de organisatie van W3C in 2023 heeft vooralsnog geen impact op de openheid van de standaardisatieprocessen en standaarden. In Nederland is er bij de overheid geen organisatie die regie voert op het gebruik van SKOS door kennis en ervaring te bundelen, de adoptie te monitoren en gebruikerseisen naar W3C terug te koppelen. De experts geven aan dat er op dit moment geen voordehand liggende partijen zijn om een regierol op zich te nemen. Wel biedt PLDN in Nederland het kennisplatform voor Linked Data en promoot het gebruik van Linked Data binnen Nederland. Omdat het aanbieden van begrippenlijsten steeds belangrijker wordt voor overheidsorganisaties, is het organiseren van een Nederlandse regierol een wenselijke stap.

Opname op de ‘pas toe of leg uit’-lijst

Alle bevraagde experts beamen dat de standaard opgenomen moet blijven op de ‘pas toe of leg uit’-lijst.

Status adoptieadviezen

Toen SKOS in 2015 op de 'pas toe of leg uit' lijst kwam, gaven de experts een aantal adviezen mee om de adoptie te stimuleren. De adoptieadviezen zijn in redelijke mate opgevolgd. In het opvolgen van de adoptieadviezen is te zien dat SKOS door Platform Linked Data Nederland (PLDN) als onderdeel van de Linked Data standaarden wordt meegenomen, bijvoorbeeld in cursussen of kennisdeling.

Lopende ontwikkelingen

Voor de SKOS standaard zelf zijn geen ontwikkelingen geweest in de afgelopen jaren en deze worden ook niet op korte termijn voorzien.

Er zijn verschillende ontwikkelingen van invloed op (adoptie van) de standaard. Al deze ontwikkelingen, zowel Europees als Nederlandse, leiden tot een verwachtte toename van het gebruik van begrippenlijsten. Standaardisatie daarin blijft relevant.

2.3.2. Aanbevelingen SKOS

Vanuit de analyse van de interviews en de bovenstaande conclusies zijn de volgende aanbevelingen opgesteld aan het Forum standaardisatie:

  1. Herformuleer het toepassingsgebied (indien nodig, via een procedure) zodat dit ook begrijpelijk is voor zij die niet bekend zijn met Linked Data, ontologieën of thesauri. Doe dit zo dat de betekenis van het toepassingsgebied niet veranderd
  2. Onderzoek of er een Nederlandse partij is die een regierol kan nemen rondom SKOS. Ga daarbij in ieder geval in gesprek met PLDN en Geonovum. Deze aanbeveling zou tegelijk opgepakt kunnen worden met de aanbeveling voor de regierol rondom het cluster aan Linked Data standaarden.

Zodra de regierol van de SKOS standaard belegd is binnen de Nederlandse overheid, zijn de volgende aanbevelingen gericht aan de partij die de regierol op zich neemt:

  1. Bepaal in hoeverre er nieuwe of aanvullende adoptieadviezen nodig zijn om de adoptie van SKOS te stimuleren, met name in het licht van de groeiende vraag bij bestuurders om semantiek en harmonisatie van taal: wanneer spreekt men over hetzelfde en wanneer over andere zaken.

3. Evaluatie Linked Data standaarden

3.1. Een semantische discussie over de term Linked Data standaarden

Voorafgaand aan de bevindingen in dit rapport willen de onderzoekers een kanttekening meegeven. Tijdens het onderzoek werd door iets minder dan de helft van de experts benoemd dat ‘Linked Data’ niet als term kan gelden voor het aanduiden van de genoemde set aan Linked Data standaarden op de lijst Aanbevolen Standaarden (OWL, RDF, RDFa, RDFS en SHACL), om verschillende redenen. Er werd benoemd dat de term Linked Data een beladen term is, men kan dan denken dat het een technische uitdaging of oplossing is terwijl het meer is dan dat. Er werd benoemd dat de term simpelweg niet een juiste beschrijving is en dat de term semantische standaarden beter de lading dekt. Er werd benoemd dat er niet moet worden uitgegaan van het soort data maar dat er geredeneerd moet worden vanuit wat je ermee wilt bereiken, denk aan het soort toepassing waar de standaarden aan bijdragen. Een knowledge graph werd als voorbeeld genoemd van de toepassing waaraan de standaarden bijdragen.

Er zijn voldoende signalen om af te vragen of de term Linked Data passend is voor de set aan standaarden. Echter, vanuit de experts is er geen eenduidig beeld ontstaan van een manier om de set aan standaarden aan te kunnen duiden. Om geen verwarring te creëren blijven de onderzoekers in dit rapport de term Linked Data standaarden hanteren. De signalen van de experts zullen een plek krijgen in de conclusies en aanbevelingen van dit rapport.

3.2. Linked Data in het algemeen

3.2.1. De Linked Data standaarden

Hieronder volgt een niet uitputtend overzicht van standaarden voor Linked Data en het semantisch web. De verschillende standaarden en hun doel worden kort toegelicht.

Linked Data standaarden op de ‘Pas toe of leg uit’-lijst

Simple Knowledge Organization System (SKOS) is een gegevensmodel om duidelijke lijsten met termen en begrippen op te stellen. Met deze termenlijsten kan informatie uit verschillende databases aan elkaar worden gekoppeld. SKOS maakt de relaties tussen begrippen inzichtelijk voor het vergelijken en interpreteren van data uit verschillende systemen.

Linked Data standaarden op de lijst Aanbevolen Standaarden

Resource Description Framework (RDF) is een standard voor het gestructureerd beschrijven van gegevens op het web. De structuur waarin de gegevens worden aangeboden wordt ook wel een triple of RDF-triple genoemd. Een eenvoudig voorbeeld van een triple: “De trein heeft de kleur geel” kan in RDF worden vastgelegd als “De trein” (resource), “heeft kleur” (eigenschap), “geel” (waarde). RDF maakt het mogelijk om geautomatiseerd data te interpreteren en te linken aan andere data(sets).

Resource Description Framework in attributes (RDFa) is een aanvulling op RDF zodat RDF toe te voegen is aan webpagina’s en documenten. RDFa is een manier om RDF- data in HTML op te nemen. Zo wordt gestructureerde data toegevoegd aan relatief ongestructureerde content waardoor relatief ongestructureerde content inzichtelijk is voor mensen en machines. Enkele experts geven aan de voorkeur te hebben voor de alternatieve standaard JSON LD in plaats van RDFa.

Resource Description Framework Schema (RDFS) is een taal waarmee de structuur van gegevens in termen van klassen, eigenschappen en datatypen kan worden beschreven. RDFS maakt het mogelijk om relaties tussen gegevens uit te drukken. Daarmee biedt het een basisvocabulaire voor kennis- en gegevensmodellering.

Web Ontology Language (OWL) wordt ingezet bij het koppelen van gegevensverzamelingen. Op deze manier worden er relaties gelegd tussen begrippen, waaronder begrippen uit verschillende domeinen. OWL maakt het mogelijk om analyses over gegevensverzamelingen (oftewel kennissystemen) heen te maken. OWL gebruikt RDF als semantiek en bouwt voort op de concepten in RDFS. OWL biedt uitgebreide vocabulaires voor datamodellering en analyse.

Shapes Constraint Language (SHACL) biedt een manier om de begrijpelijkheid en kwaliteit van gegevensverzamelingen te verbeteren. Met SHACL is het mogelijk om condities op datasets uit te drukken. Het beschrijft gegevensstructuren en biedt tevens instructies, voor machines, om gegevensstructuren te valideren. Met SHACL kan er een beschrijving (‘bijsluiter’) worden gemaakt voor een dataset die zowel voor mensen als machines leesbaar is.

Aan Linked Data gerelateerde standaarden op de lijst Aanbevolen standaarden

Uniform Resource Identifier (URI) en Internationalized Resource Identifier (IRI) zijn standaarden voor identificeren van een specifieke resource. De unieke sequentie aan karakters wordt toegekend aan een logische of fysieke resource zodat die te identificeren is. In de Linked Data principes staat dat URIs gebruikt moeten worden om naar dingen te linken. RDF maakt gebruikt van IRI in de RDF-triples.

Data Catalog Vocabulary (DCAT) is een metadatastandaard voor het verbeteren van interoperabiliteit tussen data catalogi gepubliceerd op het internet. DCAT is een OWL ontologie gebaseerd op RDF. DCAT-AP-DONL is een Nederlands toepassingsprofiel voor datasets met de specificatie van metadata die de Nederlandse overheid gebruikt specifiek voor het Dataregister van de Nederlandse Overheid. Een generiek Nederlands profiel op DCAT is in ontwikkeling. GeoDCAT-AP-NL is een uitbreiding op het DCAT profiel voor het geo-domein.

Metamodel Informatiemodellering (MIM) is een standaard om informatiemodellen beter op elkaar aan te laten sluiten. Het is een metamodel waardoor de interoperabiliteit van metamodellen verbeterd wordt. Hoe deze informatiemodellen gemaakt worden, is techniek onafhankelijk. MIM kan geïmplementeerd worden in meerdere talen zoals UML en ook Linked Data (RDF/OWL/SHACL).

Aan Linked Data gerelateerde standaarden niet op de lijst open standaarden

SPARQL is een standaard om databronnen en graven (graphs), die in RDF zijn vastgelegd of die omgezet kunnen worden naar RDF, te bevragen middels zoekopdrachten. Met deze standaard is het mogelijk om informatie op te vragen of data te verwerken en verrijken uit RDF triple stores. GeoSPARQL is een uitbreiding op SPARQL specifiek voor de geo-domein.

Dublin Core Metadata Terms (DCMI Terms) is een standaard voor het categoriseren van informatie en het verbeteren van de indexering van document voor bijvoorbeeld zoekmachines. De metadata termen kunnen worden uitgedrukt in RDF vocabulaire, maar ook in XML, JSON en UML.

Standaard voor Beschrijven van Begrippen (SBB) (nog in ontwikkeling) is een Nederlandse standaard voor het beschrijven van begrippen in een begrippenkader. Informatie wordt beter vindbaar doordat de beschrijvingen van begrippen bij zoekopdrachten nieuwe ingangen bieden tot de informatie. SKOS wordt door

organisaties net anders geïmplementeerd; een uniforme manier voor het beschrijven van gegevens zorgt voor een betere toepassing van SKOS. SBB kan met of zonder SKOS worden toegepast.

Uitbreidingen op de Linked Data standaarden

De uitbreidingen op de Linked Data standaarden zijn tot stand gekomen door werkgroepen van de W3C en zijn in beheer of in ontwikkeling bij de W3C.

Simple Knowledge Organization System eXtension for Labels (SKOS-XL) is een uitbreiding op SKOS voor heb beschrijven en linken van de betekenis van begrippen en termen in context of zinsopbouw. Dit is relevant om de meertaligheid van labels beter te ondersteunen. In Nederland wordt dit onder andere door Beeld en Geluid toegepast.

SKOS-XL is als standaard in beheer door W3C sinds 2008.

RDF-star (in ontwikkeling) is een uitbreiding op RDF 1.1. en SPARQL 1.1. waardoor het mogelijk wordt om statements over statements te maken en te bevragen. RDF-star is een standaard in ontwikkeling bij een werkgroep van W3C. De verwachtte opleveringen van de standaard is in augustus 2024.

Overige standaarden

Er zijn verschillende (domein)standaarden die zich baseren op een of meerdere Linked Data standaarden. Voorbeelden zijn NEN3610,GWSW, de Aquo-standaard,SKOS-Lex en IMBOR LD. Daarnaast wordt Linked Data aan bestaande technieken en standaarden toegevoegd zodat deze technieken of standaarden ook met Linked Data kunnen omgaan of zodat ze tevens gegevens kunnen omzetten naar Linked Data. Een voorbeeld is JSONLD.Thesauri en Ontologieën voor Overheidsinformatie (TOOI) is een standaard voor een gemeenschappelijke taal voor overheidsinformatie. Het bestaat uit een ontologie, thesaurus, register en waardelijst. TOOI is RDF gebaseerd.

3.2.2. Samenhang tussen de Linked Data standaarden

De experts geven aan dat de Linked Data standaarden op elkaar doorwerken, ze gaan hand in hand. Het is afhankelijk van de context welke standaarden nodig zijn. Niet alle standaarden zijn ten alle tijden tegelijk te gebruiken.

Om die reden delen de onderzoekers de standaarden op in vier categorieën. Er zijn standaarden die nodig zijn om data vast te leggen of om te kunnen zetten in Linked Data, dit zijn de standaarden voor de basis. Afhankelijk van de toepassing en de gewenste complexiteit van het model worden er verschillende standaarden gebruikt, deze zijn voor het informatie/kennismodel. Er zijn standaarden om Linked Data modellen te bevragen, dit is voor het bevragen informatie/kennismodel. Daarnaast zijn er standaarden voor het beschrijven van begrippen, die hebben een gerichte toepassing, deze dienen voor begrippenkaders en waardenlijsten.

Hieronder worden de generieke standaarden beschreven die binnen de genoemde lagen vallen. Extensies en domein specifieke standaarden worden buiten beschouwing gelaten aangezien ze een specifiek toepassingsgebied hebben.

Basis

URI en IRI zijn de standaarden die het gelinkte aspect van Linked Data mogelijk maken. RDF is de standaard die ervoor zorgt dat data op eenzelfde manier vastgelegd wordt, en is de basis van alle Linked Data standaarden. Voor Linked Data is er tenminste RDF (en daarmee URI of IRI) nodig.

Informatie/kennismodel

RDFS is een simpele manier om een datamodel te creëren door relaties aan te geven tussen de RDF data. Afhankelijk van de context kan een organisatie kiezen om RDFS in te zetten, of om OWL of SHACL toe te voegen. OWL biedt tevens een manier om een informatiemodel te creëren maar biedt meer mogelijkheden om meer en andere relaties te definiëren; dit zorgt voor meer complexiteit maar aan de andere kant ook voor meer mogelijkheden voor automatische analyses. Applicaties kunnen op basis van OWL ontologie logisch beredeneren. OWL bouwt voort op elementen vanuit RDFS. SHACL is een manier om (beperkende) condities op te leggen aan een datamodel en het maakt analyses van datamodellen mogelijk. SHACL kent niet alle functionaliteit die OWL kent en is minder complex. Meer over de overeenkomsten en verschillen tussen OWL en SHACL in paragraaf 3.3.2.

Bevragen informatie/kennismodel

SPARQL wordt gebruikt om de informatiemodellen te bevragen. Hier kunnen andere technieken voor worden gebruikt, SPARQL is het echter specifiek ingestoken op het bevragen van RDF triple stores.

Begrippenkaders en waardenlijsten

SKOS is een standaard manier om een begrippenkader op te stellen waardoor ze deelbaar en herbruikbaar zijn. De meeste organisaties gebruiken SKOS om vocabulaires te maken of aan elkaar te koppelen. Dit maakt mogelijk dat definities hergebruikt kunnen worden. SBB (nog in ontwikkeling) zorgt ervoor dat de begrippen op een eenduidige manier beschreven worden en is compatible met SKOS (maar kan ook zonder SKOS worden gebruikt). Experts geven aan dat organisaties er steeds vaker voor kiezen om eerst een begrippenkader vast te stellen voordat een informatiemodel wordt ontwikkeld. Hiermee ontstaat er een eenduidige basis voor de verdere uitwerking en toepassing van Linked Data.

3.2.3. Toegevoegde waarde Linked Data standaarden

De Linked Data standaarden blinken uit daar waar data vindbaar gemaakt moet worden omdat Linked Data standaarden bijdragen aan eenduidige betekenis van afzonderlijke eigenschappen. Data integratie is hetgeen waar Linked Data voor wordt ingezet bij organisaties. Data zit vaak ‘verstopt’ in silo’s. Door deze silo’s te koppelen en te relateren, zoals via Linked Data, wordt data beter bruikbaar. Er zijn geen sectoren waar het de Linked Data principes niet bruikbaar zijn. In sectoren waar data uitermate gevoelig is, bijvoorbeeld bij de geheime diensten, zullen ze Linked Data (modellen) niet publiceren, maar is Linked Data intern nog steeds bruikbaar voor een efficiëntere bedrijfsvoering.

Linked Data is niet per definitie open data. Het is tevens binnen organisatiegrenzen bruikbaar en waardevol.

Met name in situaties waar data kan worden gebruikt vanuit andere datasets valt er veel te winnen middels Linked Data. Een voorbeeld is het Kadaster. De basisregistraties binnen en buiten het Kadaster zijn opgezet binnen de eigen silo's. Er is geen interoperabiliteit dus deze gegevens worden gekopieerd door een synchronisatiebatch. Het kost op dit moment werk om de registraties in lijn met elkaar te houden, dat geldt bovendien voor alle partijen die de data uit de basisregistraties gebruiken. Als basisregistraties interoperabel zijn door middel van Linked Data dan zou je naar de data kunnen linken. Het verbinden van data uit deze verschillende silo's voorkomt dubbele invoer of dubbele registratie van dezelfde eigenschappen. Een groot deel van het werk om te controleren of data vanuit registraties in overeenstemming is, zal dankzij Linked Data niet meer nodig zijn.

3.2.4. Beheer van de Linked Data standaarden

Het beheer van de Linked Data standaarden is bij W3C belegd. De meeste standaarden zijn zeer stabiel, er zijn weinig veranderingen en de verwachting is niet dat de Linked Data principes ingrijpend wijzigen. Nieuwe standaarden of uitbreidingen komen vanuit de markt en worden door werkgroepen van de W3C opgepakt. Het beheer is volgens experts goed ingevuld door een betrouwbare en gevestigde beheerorganisatie. De Vrije Universiteit Amsterdam is lid van W3C en is betrokken bij de ontwikkeling van de standaarden door deel te nemen in de werkgroepen indien die er zijn voor de Linked Data standaarden.

W3C heeft in 2023 een verandering ondergaan, het W3C is een public interest non-profit organization geworden. W3C had voorheen geen eigen rechtspersoon, er waren vier hostende eigenaren die internationaal waren verspreid. Tim Berners-Lee zal uiteindelijk stoppen als algemeen directeur. Het beheer van standaarden gaat regulier door en blijft georganiseerd met werkgroepen. De financiering blijft bestaan uit ledeninkomsten. Wat er gaat veranderen aan de bijdrage die de hostende partijen eerder deden is nog niet duidelijk. Wel heeft W3C duidelijk gesteld dat het proces van standaardisatie, en de openheid van de standaarden met de nieuwe governance van de organisatie niet veranderen. De Linked Data standaarden van W3C blijven dus onveranderd voldoen aan het criterium 'open standaardisatieproces' van het Forum Standaardisatie.

Op dit moment is er geen Nederlandse overheid in de ‘regierol’ voor het beheer van de standaard op de lijst. Het invullen van de rol is van belang omdat Linked Data standaarden relevant zijn in, en zich verder ontwikkelen in samenhang met, lopende ontwikkelingen (Joinup op Europees vlak, het federatief datastelsel in Nederland). Voor de Nederlandse regierol voor de Linked Data standaarden is er vooral behoefte aan een gevestigde partij die de rol over verschillende domeinen op zich kan nemen. Linked Data is generiek en speelt zich niet af in een bepaald domein waardoor het lastig is om daar nu een regiepartij voor aan te wijzen. Geonovum wordt een aantal keer genoemd als een partij die de taken, van kennisdeling en adoptieondersteuning, op zich zou kunnen nemen. Echter Geonovum specialiseert zich doorgaans op het geo-domein en de Linked Data standaarden worden breder toegepast. Platform Linked Data Nederland (PLDN) wordt tevens meermaals genoemd. PLDN is reeds actief op het gebied van kennisdeling en gebruik promoten. Echter er wordt aangegeven dat PDLN niet op een dergelijke wijze georganiseerd is om structureel adoptieondersteuning te bieden. VU wordt genoemd aangezien ze betrokken zijn bij het W3C, maar ziet voor zichzelf geen rol om dergelijke regieactiviteiten op zich te nemen.

3.3. Linked Data toegepast

3.3.1. Adoptie Linked Data standaarden

The Linked Open Data Cloud laat zien welke (de bij hen bekende) datasets er aan elkaar gekoppeld zijn en toont in welke domeinen deze datasets een rol hebben. DBpedia is een van de grootste communities die zich bezig houdt met het opzetten van een open knowledge graph gebaseerd op informatie vanuit Wikipedia. De data in DBpedia is RDF Linked Data en is te bevragen met SPARQL. Hierdoor is de data bruikbaar voor allerlei verassende toepassingen en bevragingen.

Onderstaand een lijst met toepassingsgebieden en partijen die Linked Data gebruiken. Deze lijst is niet volledig maar geeft met name een beeld van de brede adoptie van Linked Data. De lijst toont met name dat de Nederlandse overheid nog niet zo ver is als het (internationale) bedrijfsleven in de adoptie van Linked Data. Hier volgt het overzicht:

  • Zoekmachines: Google, Bing
  • Social Media: Facebook, LinkedIn, Pinterest
  • Digitale dienstverleners: Uber, Airbnb, Spotify, UberEats, Netflix
  • Retail: Walmart, Ebay, Renault, Siemens, Amazon, Best Buy, IKEA, Alibaba
  • Transport en logistiek: Schiphol
  • Publicaties: Wolters Kluwer, IOS Press, Elsevier, Springer Nature, Bodleian Libraries, Kungl Biblioteket, Library of Congres, Europeanam Deutsche National Bibliothek
  • Media: The New York Times, BBC, Reuters
  • Zakelijke dienstverlening: Deloitte, IBM, Accenture, TNO
  • Financiële dienstverlening: Euromoney
  • Gezondheidswetenschap: National Institutes of Health, Centre for Big Data Research in Health, Roche, RIVM, PubMed, Cochrane
  • Overheid: Overheid.nl, European Commission, Kadaster, Politie, Belastingdienst, Kennisnet, DUO, Ministerie van Financiën, RWS, Forum Standaardisatie

In Nederland wordt er ingezet op Linked Data, al gaat de adoptie gestaag. Op het leveranciers thesaurusplatform BegrippenXL, worden begrippenlijsten conform SKOS gepubliceerd. Voorbeelden zijn het RDW thesaurus, Provincie Utrecht thesaurus, de Forum Standaardisatie woordenlijst en IMGEO objectencatalogus. De Linked OpenVocabularies (LOV) geeft een goed beeld van de SKOS vocabulaires die gebruikt worden, er zijn namelijk 152 datasets die SKOS gebaseerd zijn, waarvan enkele uit Nederland.

Linked Data in de erfgoed sector

Een voorbeeld van prominent gebruik van Linked Data standaarden in Nederland is in de culturele erfgoed sector. In deze sector is het gelukt om het hele erfgoeddomein te laten werken via Linked Data. In 2015 is er een nationale strategie digitaal erfgoed geschreven op initiatief van OWC en nationale organisaties (KNAW Humanities Cluster, Koninklijke Bibliotheek, Nationaal Archief, Beeld & Geluid, en Rijksdienst voor het Cultureel Erfgoed). In 2021 is de strategie geactualiseerd en is ook Het Nieuwe Instituut onderdeel van het netwerk geworden. Deze partijen vormen het bestuur van het Nationaal Digitaal Erfgoed (NDE).

Onderdeel van de strategie is het werken aan een referentiearchitectuur genaamd de Digitale Erfgoed Referentie Architectuur (DERA). De DERA vormt het kader voor het verbinden van collecties. Met de referentiearchitectuur kunnen er sector overstijgende afspraken gemaakt worden voor de samenwerking. Veel van de doelen of principes in de DERA staan voor het toepassen van Linked Data. Voor het publiceren en verbinden van erfgoedinformatie verplicht de DERA de toepassing van Linked Data-principes. Dit is nodig om te kunnen voldoen aan principe 5 (zorg dat erfgoedinformatie verwijst) en principe 6 (zorg dat erfgoedinformatie verwijsbaar is).

Het is NDE samen met leveranciers van registratiesystemen voor de erfgoedsector gelukt om software aan te passen aan de referentiearchitectuur. Het traject om software overeen te laten komen met de referentiearchitectuur is in mei 2023 begonnen en inmiddels hebben 85 organisaties zich gemeld om te starten. Ongeveer 80% van de softwareleveranciers bieden een pakket wat compatible is met de uitgangspunten in de nationale strategie.

Het NDE heeft, in samenwerking haar dragende instellingen waaronder het nationaal Archief, het datasetregister en het Termennetwerk opgericht. Het datasetregister geeft inzicht in de beschikbaarheid van datasets in het erfgoedveld en stimuleert het gebruik van deze datasets. Het Termennetwerk voorziet collectiebeheerders van eenduidige termen die zij voor hun materiaal kunnen gebruiken. Het Termennetwerk is gebouwd als een zoekmachine die rechtstreeks zoekt in de beschikbare terminologiebronnen.

Inmiddels is de software van de leveranciers gekoppeld aan het Termennetwerk. Het Termennetwerk is op SKOS gebaseerd. Noemenswaardig is dat het NDE Termennetwerk API de derde plaats heeft behaald in de verkiezing voor de gouden API 2023 voor vooruitstrevende API initiatieven, uitgereikt door Kennisplatform API.

Het NDE programma werkt aan een knowledge graph om op die manier afnemers de weg wijzen naar de beschikbare data in het netwerk. Op deze manier wordt er daadwerkelijk een federatieve open infrastructuur voor het delen van gegevens gerealiseerd.

Linked Data bij Ministerie van Financiën

De Rijksfinanciën kent veel informatieartefacten, aldus Flores Bakker tijdens de PLDN sessie ‘De Miljoenennota met Linked Data’ op 10 maart 2022. Denk aan wetten, regelingen, voorschriften, Miljoenennota, Voorjaarsnota, Najaarsnota, begrotingen, jaarverslagen, rapportages en evaluaties. Veel van deze artefacten zijn HTML- documenten. De informatiehuishouding van deze artefacten was niet op orde waardoor er veel bewerkbaarheid, redundantie, lage datakwaliteit en lage uitwisselbaarheid was van de documenten.

In 2020 is er een proof-of-concept met Linked Data gedaan om te onderzoeken wat Linked Data kan bieden. Hierdoor is er een eerste model van de begrotingsstructuur ontwikkeld en werden informatieartefacten door middel van RDF en SPARQL gemodelleerd. Dit was niet perfect maar het was een positieve eerste stap.

Daaropvolgend is een proef uitgevoerd om een bibliotheek te ontwikkelen voor informatieartefacten in de rijksbegroting. Bovendien is er een woordenlijst in SKOSMOS met definities van termen die gebruikt worden door het Ministerie van Financiën.

Vanaf 2021 wordt er gewerkt aan een HTML-vocabulaire in Linked Data (RDF en SHACL). Door dit te doen werd het mogelijk voor gebruikers om informatieartefacten betekenisvol op te schrijven. Het werd onder andere mogelijk om HTML-documenten automatisch te generen, sjablonen te hanteren, aanpassingen universeel toepassen, kwaliteit van HTML-documenten automatisch toetsen.

Een wens is om toe te werken naar meer gebruik en consumptie van Linked Data, dat is een uitdaging. Er zijn weinig applicaties die mooie dingen doen met Linked Data. Zo is er een dashboard (Onrechtmatigheidsdashboard) gecreëerd om aan te tonen dat het nut heeft om Linked Data te gebruiken. Consumptie van Linked Data vereist het kijken naar stakeholders buiten Ministerie van Financiën, zodoende wordt er een datahub ontwikkeld die kan bijdragen aan het verbinden van knooppunten binnen de Rijksoverheid.

Linked Data implementatie door gemeenten

De Linked Data standaarden worden minder gebruikt door gemeenten. Enkele gemeenten hebben vocabulaires gebaseerd op SKOS gepubliceerd, bijvoorbeeld op BegrippenXL. Een expert geeft aan dat gemeenten niet actief zijn op het linken van data, met uitzondering van de grotere gemeenten, omdat zij andere prioriteiten hebben. Ook in gemeentelijke ontwikkelingen zoals Common Ground of Het Gemeentelijke Gegevensmodel (GGM) speelt Linked Data geen rol. Het is wel de ambitie is om GGM uiteindelijk in lijn te brengen met SKOS.

3.3.2. Ontwikkelingen Linked Data standaarden

Linked Data techniek bestaat al jaren en de inzet van Linked Data groeit gestaag. Er zijn verschillende ontwikkelingen die bijdragen aan de verdere adoptie en ontwikkeling van Linked Data technieken en standaarden.

Europese ontwikkelingen

Grote internationale spelers zoals Google of Facebook zijn zeer succesvol doordat ze data weten te benutten middels Linked Data technieken. Hun manier om data te linken en semantiek toe te voegen wordt de industrie standaard, met name in Amerika. De eigen standaarden van deze technologie giganten zijn gemaakt door de bedrijven voor de bedrijven. Europa kiest een andere koers die de normen en waarden binnen Europa beter vertegenwoordigt. Standaarden worden in open initiatieven ontwikkelt met deelname van overheid, het bedrijfsleven en de burger. Het maatschappelijke belang zit hier doorheen verweven. Wetgeving, acts, richtlijnen en ook standaarden ontstaan vanuit dit gedachtegoed. Nederland doet hieraan mee en zal aansluiten bij deze ontwikkelingen.

De Linked Data standaarden passen bij de recente ontwikkelingen vanuit Europa vanuit het Digital Decade policy programma 2030. Joinup is een, door de Europese Commissie opgezette, shop voor interoperabele, open en gratis ICT oplossingen voor de digitale overheid. Semantiek is een van de onderwerpen binnen Joinup en daarbinnen worden onder andere e-Government Core Vocabularies ontwikkelt voor uniforme vocabulaires binnen lidstaten. Hierin wordt er gebruik gemaakt van Linked Data principes zoals het gebruik van URI, RDF, JSON LD en SHACL.

Federatief datastelsel

Voor het federatief datastelsel zijn samenhangende standaarden zoals de Linked Standaarden nodig. Enkele experts geven aan dat er wordt gesproken dat partijen die meedoen aan het federatief stelsel moeten voldoen aan de Linked Data standaarden. Dit is echter nog niet vastgesteld. Voor het federatief datastelsel worden tevens W3C standaarden ontwikkeld middels Europese financiering, onder andere door Gaia-X. Een van de standaarden is het Verifiable Credentials Data Model waarin URI een prominente rol heeft voor het identificeren van attributen en waar JSON LD een rol speelt als syntax.

API ontwikkeling

In Nederland is er een beweging gaande richting het gebruiken van REST APIs om informatie uit te wisselen. Experts geven aan dat het gebruik van APIs het gebruik van Linked Data niet uitsluit. Een voorbeeld is het behalen van de derde plaats van de Termennetwerk API van Netwerk Digitaal Erfgoed in de verkiezing voor de gouden API 2023 voor vooruitstrevende API initiatieven, uitgereikt door Kennisplatform API. Het is inmiddels mogelijk om Linked Data te ontsluiten middels bijvoorbeeld OGC APIs. In REST API wordt inmiddels URI toegevoegd, dit was eerder niet mogelijk.

In de praktijk komt het nog niet vaak voor dat Linked Data middels APIs ontsloten worden. De meeste ontwikkelaars werken met ontwikkeltalen waar Linked Data nog niet in is geïntegreerd. Wel ontstaat hier een kanteling doordat er steeds meer Linked Data profielen ontwikkeld worden, denk aan JSON LD. Door dit soort kantelingen zal Linked Data steeds meer een voet krijgen in de traditionele wereld.

OWL versus SHACL

De meningen van de experts verschillen over het nut en de noodzaak van OWL. Enkele experts geven aan dat OWL weinig wordt gebruikt en dat het beperkingen kent. OWL is duur in rekenkracht en in menselijke investering. Daar waar het van uitermate belang is dat het kennissysteem of knowlegde graph zeer gedetailleerd wordt opgesteld heeft OWL zeker meerwaarde, bijvoorbeeld in de gezondheidszorg. SNOMED is het internationale medisch terminologiestelsel van en voor zorgprofessionals. RDFS was niet rijk genoeg voor het vastleggen van zoveel informaties en condities. Er wordt bijvoorbeeld vastgelegd dat iemand twee longen heeft waarvan één linkerlong die anders is dan de rechterlong.

Dit kan niet met RDFS. Ook in de financiële wereld heeft OWL meerwaarde.

SHACL wordt daarentegen steeds meer gebruikt, maar is ook nog relatief nieuw (juli 2017). SHACL lijkt voor veel partijen meer voor de hand te liggen om toe te passen dan OWL, onder andere omdat SHACL minder complex is. Het sluit OWL niet uit maar in de praktijk waar SHACL wordt gebruikt worden er slechts enkele elementen uit OWL nog gebruikt.

Overige trends en ontwikkelingen

Alle trends die zich baseren op data integratie, zoals Artificial Intelligence en Digital Twins, hebben of krijgen in meer of mindere mate te maken met Linked Data.

Een van de onderwerpen die bij W3C speelt is de ontwikkeling van HTTP naar HTTPS. Er wordt nagedacht over het stoppen met HTTP, maar dit kan zorgen voor problemen aangezien veel URI zijn gedefinieerd in HTTP. De Nationale URI-strategie beperkt zich tot aanbevelingen voor HTTP-URIs.

3.3.3. Uitdagingen voor Nederlandse overheidsorganisaties

Er zijn meerdere uitdagingen te benoemen bij het toepassen van de Linked Data standaarden, in dit deel ligt de focus op de uitdagingen voor Nederlandse overheidsorganisaties.

Verschil in interpretatie en invulling

Standaarden, waaronder SKOS, bieden ruimte voor interpretatie in de toepassing ervan. Voor SKOS bijvoorbeeld geldt dit bij het opstellen van definities. Zo ontstaat er ruimte voor een eigen invulling en kunnen Linked Data implementaties van elkaar afwijken. Dit staat de interoperabiliteit van deze implementaties in de weg. Het gebeurt vaker dat er een applicatieprofiel wordt opgesteld voor dergelijke standaarden die ruimte voor interpretatie laten. Een applicatieprofiel bevat adviezen over hoe een standaard te gebruiken is waardoor er eenzelfde toepassing ontstaat. De SBB standaard biedt een standaard manier voor het beschrijven van begrippen, SKOS is een van de uitdrukkingsvormen begrippenlijsten die conform SBB zijn opgesteld. Er zijn echter ook andere standaarden te gebruiken.

Omvang en hoeveelheid aan leveranciers

Er is veel marktondersteuning voor het toepassen van Linked Data. Er zijn verschillende voorzieningen en diensten die aangeboden worden. Een aantal marktpartijen zijn in Nederland gevestigd, meer zijn er gevestigd buiten Nederland. Met name grote internationale leveranciers hebben zich ontwikkeld op dit vlak. Er zijn partijen die zich richten op de ondersteuning en begeleiding van Linked Data projecten en toepassingen. Er zijn tevens partijen die zich specialiseren in het ontwikkelen en/of opslaan van knowledge graphs en analyses op basis van Linked Data. Kortom, er zijn veel commerciële pakketten waaruit gekozen kan worden.

Nederlandse partijen in 2023 zijn onder andere Taxonic, OpenInc, Triply, ArchiXL, Oracle en Semtech. Vanuit experts komt naar voren dat er ruimte is voor meer en nieuwe marktpartijen met name in Nederland. Zodra Linked Data ingezet wordt in de kritische bedrijfsprocessen dan is het van belang dat de diensten van de betrokken leveranciers stabiel genoeg zijn om continue dienstverlening mogelijk te maken. Tegelijkertijd moeten deze leveranciers groot genoeg zijn om eventueel schade, bijvoorbeeld doordat dienstverlening stil komt te liggen, op te kunnen vangen. Er zijn leveranciers die hier groot genoeg voor zijn, denk aan Micro logic en Snowdog, maar dit zijn Amerikaanse bedrijven met nauwelijks een basis in Nederland. De Nederlandse partijen zijn weliswaar goed in de Linked Data diensten die ze aanbieden maar (nog) niet groot genoeg om de stabiliteit en zekerheid te bieden voor organisaties die Linked Data willen integreren in

kritische bedrijfsprocessen. Overheidspartijen, waaronder Kadaster, zijn terughoudend om over te gaan op het inzetten van Linked Data in kritische bedrijfsprocessen.

Tegelijkertijd is de markt in Nederland nog niet geheel volwassen, met name voor de nieuwere ontwikkelingen zoals het gebruik van SHACL. De huidige schaal van de markt kan zorgen voor problemen. Er ontstaan Linked Data maatwerkoplossingen door systemen te gebruiken die niet ingericht zijn voor Linked Data toepassingen.

Een tekort aan Linked Data specialisten

Voor het toepassen en gebruiken van Linked Data is er een andere manier van denken nodig, niet meer vanuit databases maar vanuit de relaties tussen data over silo’s heen. Mensen die werken met data moeten bewust worden gemaakt van deze andere manier van denken. Zij werken vaak op de traditionele manier met relationele databases. Hen opleiden en bewust maken van de meerwaarde van Linked Data is een uitdaging. Er zijn bovendien niet voldoende mensen opgeleid in het veld van Linked Data.

Beperkte toepassingen op basis van Linked Data

Meerdere experts benoemen dat de meeste implementaties van Linked Data gaan om het beschrijven van metadata middels Linked Data standaarden of het publiceren van datasets middels Linked Data. De droom van Linked Data en het semantische web is om data tussen organisaties te verbinden en om dit semantisch web toegankelijk te maken voor iedereen. In de praktijk zijn er met name voorbeelden van Linked Data om data integratie binnen het bedrijf te bewerkstelligen. Dit heeft tevens meerwaarde, met name voor de grote organisaties, maar het benut niet het volledige potentieel van Linked Data.

In de erfgoedsector zijn meerdere voorbeelden van de inzet van Linked Data om data tussen organisaties te verbinden, zoals Oorlogsbronnen. Het NDE onderzoekt hoe Linked Data kan passen binnen user interfaces, dit moet leiden tot concrete Linked Data diensten voor gebruikers. Er zijn wel concrete diensten te benoemen, denk aan het Stadsarchief voor Amsterdam of het Van Gogh Worldwide platform. Het NDE helpt individuele erfgoedinstellingen met dit onderwerp.

Het aantal voorbeelden van toepassingen/diensten beschikbaar voor (eind)gebruikers ontstaan uit deze Linked Data datasets blijft echter beperkt.

Beperkte legitimiteit van Linked Data

De adoptie van Linked Data bij de Nederlandse overheid gaat langzaam; dit kent vele redenen. Een van die redenen is dat er geen eenduidige beleid is ingericht op het verder uitrollen van Linked Data. Er wordt wel geroepen om standaarden die hergebruik van data mogelijk maken maar hier wordt verder geen invulling aan gegeven. De experts vinden dat de digitale overheid er baat bij heeft om meer in te zetten op Linked Data als middel om de gegevenshuishouding beter op orde te krijgen. Dit vereist dat de top van de Nederlandse overheid de legitimiteit van het inzetten op Linked Data inziet. Bovendien vereist dit het beleggen van de rol om Linked Data uit te dragen bij een overheidspartij met de daarbij behorende budgetten en mandaat.

Het feit dat er geen eenduidig beleid is zorgt ervoor dat onder andere Kadaster bepaalde Linked Data koppelsets niet officieel zal publiceren. Het is namelijk niet duidelijk wie hier verantwoordelijk voor is. Dit soort koppelsets bevatten meerdere datasets, en ook al is het open data er zijn krachtige inzichten uit op te halen. Om dit soort koppelsets officieel in gebruik te nemen moet het beleid en eigenaarschap hierop goed geregeld zijn.

Een centrale rol is gewenst, dit zou bij een regierol kunnen passen zoals toegelicht in paragraaf 3.2.4. In België heeft Digitaal Vlaanderen deze rol toebedeeld gekregen zoals

via Open Standaarden voor Linkende Overheden (OSLO). Semantische standaarden hebben hier een prominente rol en dit wordt uitgedragen door Digitaal Vlaanderen.

3.4. Het cluster Linked Data standaarden

Bijna alle experts zien meerwaarde in een geclusterde registratie van de Linked Data standaarden op de lijst open standaarden. Experts benoemen dat voor het bereiken van de Linked Data principes, zoals toegankelijke data, meerdere standaarden nodig zijn. Er worden wel uitdagingen en randvoorwaarden genoemd. Hieronder volgen de inzichten vanuit de experts.

3.4.1. Basisset aan Linked Data standaarden

De meeste experts spreken van een smalle basisset aan Linked Data standaarden, betreffende standaarden voor de basis, standaarden voor het informatie/kennismodel en standaarden voor het bevragen van het informatie/kennismodel (zie paragraaf 3.2.2). De basisset betreft standaarden die in basis nodig zijn om aan Linked Data te kunnen doen. Standaarden die dan altijd genoemd worden zijn RDF, RDFS, OWL, SHACL en SPARQL. Standaarden die soms wel en soms niet genoemd worden zijn MIM, DCAT en DCMI terms.

De standaarden die buiten de basisset vallen zijn specifieke domeinstandaarden (GWSW) of extensies op de standaarden (SKOS-XL). Deze standaarden zijn relevant in een specifieke context maar niet zo generiek inzetbaar dat ze een logische plek krijgen in een basisset.

Om standaarden specifiek voor begrippen op te nemen in de basisset, in het bijzonder SKOS, is een discussiepunt. De argumenten tegen het opnemen in een basisset is dat SKOS een laagdrempelige manier is om aan de slag te gaan met Linked data, zonder dat andere Linked Data standaarden bewust toegepast moeten worden. Door SKOS apart op de ‘pas toe of leg uit’-lijst te laten staan kunnen partijen er eerder toe bewogen worden om eerste stappen te zetten op het vlak van harmonisatie van taal en semantiek door begrippen deelbaar en toegankelijk te maken. Argumenten voor het opnemen in een basisset is dat het logisch is om partijen die een stap zetten met SKOS te informeren over de vervolgstappen.

3.4.2. Aandachtspunten cluster Linked Data standaarden

Het ‘verplicht’ stellen van alle Linked Data standaarden in het cluster stuit bij veel experts op weerstand. Experts geven aan dat het gebruik van de standaarden afhankelijk is van de context en de toepassing waar Linked Data wordt ingezet, de use case als het ware. Niet elke context of use case vraagt om dezelfde set verplichte of aanbevolen standaarden. Dit is duidelijk te zien bij RDFS en OWL. De experts geven aan dat ze OWL niet willen verplichten tenzij het relevant is voor de use case van de gebruiker. Daarnaast willen alle experts de status van SKOS, met een plek op ‘pas toe of leg uit’-lijst, behouden (zie ook paragraaf 2.3.1).

Het clusteren van standaarden heeft als gevolg dat er gelaagdheid in het toepassingsgebied ontstaat. Er is een toepassingsgebied voor het cluster als het geheel en toepassingsgebieden voor de standaarden binnen het cluster. Als de Linked Data standaarden worden aangeboden als een cluster dan is het van groot belang om het toepassingsgebied van het cluster als geheel duidelijk op te stellen. Daarnaast moeten de toepassingsgebieden van de individuele standaarden duidelijk worden beschreven en moet de samenhang tussen de standaarden expliciet worden gemaakt.

Bij het clusteren van de standaarden moet er tevens goed worden nagedacht over de naamgeving van het cluster, zoals toegelicht in paragraaf 3.1. Voorbeelden van namen

zijn Linked Data standaarden, de semantische standaarden of de knowledge graph

standaarden.

3.4.3. Scenario’s cluster Linked Data standaarden

Experts hebben een aantal voorstellen gedaan voor de manier waarop de Linked Data standaarden (RDF, RDFS, OWL, SHACL, SPARQL en SKOS) al dan niet geclusterd kunnen worden. Een kanttekening is dat SPARQL op dit moment niet op de lijsten van het Forum Standaardisatie staat. Hieronder volgen de voorstellen:

Optie Toelichting
1. Niet clusteren, wel verbinden De Linked Data standaarden blijven als afzonderlijke standaarden op de lijsten van het Forum Standaardisatie staan, dit geldt tevens voor SKOS. Een kanttekening is dat enkele experts aangaven dat de samenhang wel aangegeven kan worden door ze te verbinden aan een overkoepelend thema, denk aan de FAIR principes.
2. Clusteren zonder SKOS Linked Data standaarden clusteren met uitzondering van SKOS. Het cluster kan dan worden aangemeld voor op de Lijst Aanbevolen Standaarden of de ‘pas toe of leg uit’-lijst. SKOS behoudt afzonderlijk zijn plek op de ‘pas toe of leg uit’-lijst.
3. Clusteren zonder OWL. Linked Data standaarden clusteren, waaronder SKOS, met uitzondering van OWL en aanmelden voor de ‘pas toe of leg uit’-lijst. OWL past niet binnen het bredere toepassingsgebied van Linked Data aangezien het een specifieke toepassing heeft en complexer is om toe te passen. Standaarden zoals MIM laten het open om OWL of andere standaarden te gebruiken, juist in die keuzevrijheid zit meerwaarde
4. Alles clusteren met keuzevrijheid Het cluster met Linked Data standaarden, waaronder SKOS, aanmelden voor de ‘pas toe of leg uit’-lijst. Alle standaarden zijn relevant afhankelijk van de toepassing. Bijvoorbeeld, als er in de toepassing geen noodzaak is voor bevragingen dan is bijvoorbeeld SPARQL niet nodig. In dat geval kan een gebruiker ‘uitleggen’ waarom het bepaalde standaarden binnen het cluster niet gebruikt. Hiermee voldoet de gebruiker aan de ‘pas toe of leg uit’ verplichting zonder dat het alle standaarden hoeft toe te passen. Wel is het hier uitermate belangrijk dat het duidelijk is wanneer standaarden wel en wanneer ze niet gebruikt moeten worden.

Tabel 3 - Opties voor het clusteren van Linked Data standaarden

De onderzoekers constateren dat er in feite slechts één lijst met standaarden door het Forum Standaardisatie gehanteerd wordt. Hierop staan standaarden met een status, een ‘pas toe of leg uit’-status of een aanbevolen status. Het is de vraag of een cluster niet standaarden kan bevatten met verschillende statussen. Hoe dit zou kunnen werken is een vervolgvraag voor het Forum Standaardisatie.

3.4.4. Toepassingsgebied koppelen aan de FAIR principes

Meerdere experts benoemen dat het toepassingsgebied van de Linked Data standaarden terug te herleiden is naar de FAIR principes of naar principes in het algemeen. Het heeft betrekking op het vindbaar (Findable), toegankelijk (Accessible), interoperabel

(Interoperable) en herbruikbaar (Reusable) maken van gegevens. Deze samenhang tussen Linked Data standaarden en FAIR principes zouden expliciet naar voren moeten komen en scherp worden gecommuniceerd via onder andere de website. Bovendien gaat FAIR verder dan Linked Data aangezien het ook principes heeft die betrekking hebben op de governance van de data.

Duurzaamheid (in de betekenis van ‘lange termijn’) is tevens een principe dat hier terug moet komen. De Linked Data of FAIR principes gaan ervan uit dat er sprake is van duurzame toegankelijkheid van data. Eenmalig een Linked Data dataset publiceren is niet voldoende. De toegang tot deze data moet duurzaam ingericht worden en de publicatie van de data moet bijgehouden worden (actualiteit), en niet na een aantal jaren ontoegankelijk worden. De principes gaan verder dan enkel het toepassen van een standaard. Hier moeten organisaties van bewust worden gemaakt.

3.5. Conclusies en aanbevelingen

3.5.1. Conclusie standaarden

De conclusie van dit onderzoek naar het al dan niet clusteren van de Linked Data standaarden (RDF, RDFS, OWL, SHACL, SPARQL en SKOS) op de lijst open standaarden is dat er meerwaarde zit in het clusteren van deze standaarden. Er is echter geen voor de hand liggende manier om de standaarden te clusteren. Welke standaarden relevant zijn is afhankelijk van de context of use case; niet elke context of use case vraagt om dezelfde set verplichte of aanbevolen standaarden.

De toegevoegde waarde, het draagvlak en het beheer van de Linked Data staan niet ter discussie. Er zijn wat aandachtspunten, bijvoorbeeld de ontbrekende invulling voor de Nederlandse regierol (een stimulerende rol met betrekking tot adoptie, betrokkenheid bij de internationale beheerorganisatie en inzet op kennisverspreiding en kennisuitwisseling). Het invullen van de rol is van belang omdat Linked Data standaarden relevant zijn in, en zich verder ontwikkelen in samenhang met, lopende ontwikkelingen (Joinup op Europees vlak, het federatief datastelsel in Nederland). De wijziging in de organisatie van W3C heeft vooralsnog geen impact op de openheid van de standaardisatieprocessen en standaarden.

De ontwikkelingen tonen aan dat Linked Data meer en meer relevant gaan worden, met name daar waar data integratie van belang is. Europese ontwikkelingen kunnen een drijvende kracht worden in het gebruik van Linked Data standaarden en technieken.

De uitdagingen tonen aan dat het Linked Data veld in ontwikkeling is. Met steeds meer implementaties van Linked Data toepassingen ontstaat er vraag naar volwassen marktpartijen, mensen met Linked Data kennis, en de uitrol van Linked Data toepassingen in reguliere bedrijfsprocessen. De grootste uitdaging zit in het breed inzetten op Linked Data, om Linked Data te kunnen gebruiken in dienstverlening moet het legitimiteit krijgen vanuit de top van de Nederlandse overheid.

3.5.2. Aanbevelingen Linked Data standaarden

Vanuit de analyse van de interviews en de bovenstaande conclusies zijn de volgende aanbevelingen opgesteld aan het Forum standaardisatie:

  1. De Linked Data standaarden zijn te verbinden aan de FAIR Het heeft betrekking op het vindbaar (Findable), toegankelijk (Accessible), interoperabel (Interoperable) en herbruikbaar (Reusable) maken van gegevens. Het advies is om te bepalen in hoeverre andersoortige standaarden (principes of richtlijnen), zoals de FAIR principes, een plek kunnen krijgen op de lijsten van het Forum Standaardisatie.
  2. Het clusteren van Linked Data standaarden op de lijst open standaarden heeft als gevolg dat er gelaagdheid in het toepassingsgebied ontstaat. Er is een toepassingsgebied voor het cluster als het geheel en toepassingsgebieden voor de standaarden binnen het cluster. Het advies is om te bepalen hoe de gelaagdheid van het toepassingsgebied van het cluster aan Linked Data standaarden vormgegeven kan worden op de lijst open standaarden.
  3. In gesprek gaan met Geonovum, Vrije Universiteit en PLDN over hoe de regierol op de Linked Data standaarden het beste ingevuld kan worden.
  4. De veranderingen omtrent de organisatie van het W3C zouden impact kunnen hebben voor de financiering en openheid van de Dit geldt voor meer standaarden dan de Linked Data standaarden. Het advies is om te onderzoeken wat de impact van de veranderingen bij W3C is op de open standaardisatie criteria.

Zodra de regierol van SKOS belegd is binnen de Nederlandse overheid, zijn de volgende aanbevelingen gericht aan de partij die de regierol op zich neemt:

  1. Bepaal samen met een afvaardiging van de Linked Data community welke standaarden in de basisset thuis horen.
  2. Verken samen met het Bureau van het Forum Standaardisatie de aanmelding van de Linked Data standaarden als cluster voor op de lijst van het Forum standaardisatie, inclusief de SPARQL standaard die nu nog niet op de lijsten van het Forum Standaardisatie staat. Bepaal, in het kader van de verkenning, samen met een afvaardiging van de Linked Data community onder welke gemeenschappelijke noemer een dergelijk cluster het beste op de lijst open standaarden kan worden aangeduid.

Documentatie-type