Inleiding

Aanleiding

In het geo-domein vindt data delen plaats via het concept van de ‘Geo-Informatie Infrastructuur’. De Geo-Informatie Infrastructuur is een internationaal concept, dat bestaat uit een samenhangend geheel van data(sets) en metadata, datadiensten, afpraken, standaarden, voorzieningen, applicaties, infrastructuur en middelen nodig voor het delen van geo-informatie. Geo-informatie wordt ook wel ‘locatiegebonden data’ genoemd. In de afgelopen 10 tot 15 jaar is in Nederland en Europa gewerkt aan respectievelijk de Nationale en Europese Geo-informatie Infrastructuur. In Nederland heeft dit geresulteerd in het (open) ontsluiten van vele (duizenden) geo-datasets en geo-dataservices op het Internet zodat de data kan worden gedownload voor (her)gebruik. Belangrijk onderdeel vormen de geo-basisregistraties (zoals BAG, BRK, BRT, BGT en BRO) als fundamentele datasets van de geo-informatie infrastructuur. Nederland heeft daarbij een set van afspraken over interoperabiliteit en standaarden gemaakt en registers voor begrippen en informatiemodellen en de vindbaarheid van geodatasets ingericht. Beleid en governance binnen de overheid, bedrijfsleven en onderwijs- en kennisinstellingen zijn eveneens vormgegeven. En vanaf 2007 is de Europese equivalent met de Implementatiewet EG-richtlijn infrastructuur ruimtelijke informatie (ook wel de INSPIRE Wet) tot stand gebracht waarmee Nederlandse geo-infomatie ook deel uitmaakt van de Europese geo-informatie infrastructuur.

Vanuit datzelfde Europa is de afgelopen jaren een uitdagende nieuwe digitaliserings- en data strategie opgesteld. De Europese digitale strategie en data strategie is bedoeld als de grote aanjager van de Europese data-economie (zie ook de Handreiking EU informatie m.b.t. digitale en data strategie). Via regulering en projecten wil de EU meer grip krijgen op haar eigen data via de realisatie van een ‘common EU data space’. Een ‘data space’ is gericht is op het veilig, vertrouwd en soeverein delen van data binnen domeinen en over domeinen heen. Wat is een data space? Wat typeert een data space? En hoe kunnen we de data space als concept gebruiken en toepassen in relatie tot de (nationale) geo-informatie infrastructuur? Dat zijn de vragen die in deze verkenning aan de orde komen. We geven daarvoor inzicht in de achterliggende beginselen en concepten van data spaces vanuit diverse data space initiatieven die in de afgelopen jaren zijn ontstaan. We onderwerpen een aantal data space initiatieven aan een quick-scan analyse en bezien welke onderwerpen aandacht krijgen en ingevuld worden of zijn voor het delen van data.

Doel

De toenemende Europese aandacht voor het delen van data tussen private en publieke partijen is een belangrijke aanleiding geweest voor deze verkenning. In diverse Europese en nationale initiatieven wordt gewerkt aan het realiseren van het maatschappelijke en economische potentieel van data delen. Deze initiatieven hebben hun eigen focus, bijvoorbeeld op de samenwerking, de bouwstenen, of op het realiseren van use cases. Wat zijn de focusgebieden van deze data space initiatieven? En wat is de positie van de geo-informatie infrastructuur als data space concept in relatie tot deze initiatieven voor het delen van data?

Deze verkenning heeft een tweeledig doel:

Zicht geven op de richtinggevende data space initiatieven in Nederland en Europa en hun focusgebieden. Daarmee inzicht krijgen in de verschillende gehanteerde concepten, actoren en bouwstenen van deze data spaces initiatieven en (in enkele gevallen) op welke wijze data space initiatieven verbonden zijn en kunnen worden;
Zicht krijgen op de positie van de Europese en Nationale Geo-informatie Infrastructuur ten opzichte van deze richtinggevende data space initiatieven. De verschillende bestaande generieke initiatieven voor het delen van data werken aan het realiseren van oplossingen voor het delen van data. Inzicht in de positie van de Nationale Geo-informatie Infrastructuur (NGII) ten opzichte van deze initiatieven zou het de NGII (en Europese GII) in staat kunnen stellen om beter bij te dragen aan de Europese en nationale data-economie. Dit leidt tot de vraag; hoe de NGII en de generieke data space initiatieven zich tot elkaar verhouden en welke aspecten de NGII binnen zijn scope moet nemen om optimaal bij te dragen aan de data-economie?

Aanpak

Deze verkenning is uitgevoerd aan de hand van deskresearch. De verschillende bronnen afkomstig van data space initiatieven zijn het belangrijkste vertrekpunt geweest voor een quick-scan analyse van de onderdelen van verschillende data space initiatieven.

De data space initiatieven zijn sterk in ontwikkeling. Samenwerkingen en coalitie-vorming vindt plaats en (technische) uitwerking van onderdelen en bouwstenen worden bekend en gepubliceerd. Ook de eerste ervaringen met (deel)implementaties worden zichtbaar. Dat betekent ook, dat deze verkenning niet af is en wordt bijgehouden en bijgewerkt op basis van nieuwe informatie en bronnen, die worden beschikbaar komen. gesteld door de data space initiatieven. Daarmee is deze verkenning vooralsnog een ‘levend’ document.

Doelgroep

De “Verkenning data spaces” is geschreven voor iedereen die betrokken is bij het uitwisselen van geo-informatie (of locatie-gebonden informatie), het toepassen van standaarden voor geo-informatie en de Nationale en Europese geo-informatie infrastructuur. Zoals informatiemanagers, stuurgroepleden, beleidsmedewerkers, projectleiders, adviseurs, architecten, IT-leveranciers, en voor personen die dataproducten, standaarden en specificaties implementeren in hun organisatie en deze geografische data producten willen delen met andere organisaties en data space initiatieven in Nederland en Europa.

Leeswijzer

Hoofdstuk 2 biedt achtergrondinformatie bij de quick-scan analyse van data space initiatieven in deze verkenning. Het data space concept van de International Data Spaces Association komt in Hoofdstuk 3 aan bod. In Hoofdstuk 4 wordt het aan de International Data Spaces nauw verwante initiatief Gaia-X besproken. Het OPENDEI raamwerk wordt in hoofdstuk 5 beschouwd en in hoofdstuk 6 het raamwerk van de Data Sharing Coalition. In hoofdstuk 7 en 8 worden achtereenvolgens de Europese en Nationale Geo-Informatie Infrastructuur beschouwd als data space initiatief. Vervolgens wordt in hoofdstuk 9 het iSHARE vertrouwenskader voor data spaces toegelicht.

Data spaces initiatieven beschouwd

Inleiding

Aanleiding voor deze verkenning is de ontwikkeling van data spaces in Europa vanuit de Europese Data Strategie, die van strategisch belang zijn voor de groei van de Europese data-economie. Het doel van de Europese data strategie [[EUSD]] is om de ontwikkeling van data waarde ketens mogelijk te maken en te stimuleren, waarbij soevereiniteit en betrouwbaarheid onder Europese waarden is gewaarborgd (zie verder de Handreiking EU informatie m.b.t. digitale en data strategie). Zoals gepresenteerd in de mededeling van de Europese Commissie van februari 2020: “De Europese strategie voor data”, is de visie om interne markten voor data te creëren, genaamd ‘common European data spaces’, waar zowel persoonlijke als niet-persoonlijke data, waaronder gevoelige bedrijfsdata [[EUSD]]:

Kan stromen binnen de EU en tussen sectoren;
Veilig zijn en worden behandeld volgens de EU-wetgeving en relevante normen;
Toegankelijk en gebruikt volgens eerlijke, praktische en duidelijke regels.”

Het doel van de Europese data spaces is het mogelijk maken om data uit de hele EU, zowel uit de publieke sector als uit het bedrijfsleven, op betrouwbare wijze en tegen lagere kosten uit te wisselen, waardoor de ontwikkeling van nieuwe data-gedreven producten en diensten wordt gestimuleerd. Data spaces bestaan uit zowel de technologische bouwstenen en infrastructuur evenals uit de governance-mechanismen. Deze functies zijn meestal georganiseerd in:

Dataplatforms – ondersteuning van het delen en uitwisselen van data;
Data marketplaatsen – ondersteuning van data-aanbod en data-aanvraag; en
Datasoevereiniteit – ondersteuning van controle en governance van datastromen.

Data space definities

Er zijn diverse synoniemen voor data spaces in omloop zijn, zoals ‘data-ecosysteem’ of enkel ‘ecosysteem’, ‘datadeelsysteem’, ‘datafederatie’ en ‘federatief datastelsel’. In deze verkenning wordt de term ‘data space’ gehanteerd mede ingegeven door de Europese Data strategie en de daaruit voorvloeiende impact voor de Nederlandse data-economie. We hebben niet de intentie een discussie te voeren over de juiste definitie van een data space, maar het gaat erom te duiden dat verschillende data space initiatieven bestaan, die ieder een bepaalde invulling geven aan het delen van data. Hieronder zijn enkele omschrijvingen van data spaces opgenomen, zoals die gevoerd worden door enkele belangrijke initiatieven.

Bron: [[IDS-RAM3, IDS-RAM4]]

“The term ‘data space’ refers to a type of data relationship between trusted partners who adhere to the same high level standards and guidelines in relation to data storage and sharing within one or many Vertical Ecosystems.”

Bron: Gaia-X

Bron: [[OPENDEI-DPR]]

“Data Spaces is an umbrella term corresponding to any ecosystem of data models, datasets, ontologies, data sharing contracts, and specialized management services (i.e., as often provided by data centers, stores, repositories, individually or within “data lakes”), together with soft competencies around it (i.e., governance, social interactions, business processes).”

Bron: [[Scerri]]

“An infrastructure that enables data transactions between different data ecosystem

parties based on the governance framework of that data space. Data space should be

generic enough to support the implementation of multiple use cases.”

Bron: [[DSCC-G]]

Het is hier niet van belang een discussie te voeren over welke definitie de juiste is. Belangrijk is te duiden, dat data spaces gaan over vertrouwd, sovereign en veilig data delen tussen de deelnemers op federatieve, gedistribueerde wijze en op basis van gezamenlijk overeengekomen afspraken en besturing. Deze aspecten van data spaces komen in de beschrijvingen naar voren. De invulling van deze aspecten om te komen tot daadwerkelijk vertrouwd, sovereign en veilig data delen is en wordt in verschillende initiatieven verder uitgewerkt. Daarmee geven deze data space initiatieven ieder een specifieke invulling aan het delen van data.

Data space initiatieven beschouwd

Anno 2023 bestaan verschillende data space initiatieven en deze zijn vaak gericht op een specifieke sector of domein. Deze initiatieven vergemakkelijken het delen van data voor hun deelnemers, zowel voor afnemers (consumenten) als aanbieders van data (producenten) in een bepaalde toepassingsdomein of vanuit een bepaald sectorperspectief. Er zijn verschillende benaderingen voor het creëren van data spaces ontwikkeld in verschillende sectorale domeinen, waarvan de geo-informatie infrastructuur er ook één is. Data spaces in het ene toepassingsdomein kunnen verder in ontwikkeling zijn en dan in het andere domein.

Naast sector- of domien specifieke data space initiatieven bestaan ook enkele cross-domein initiatieven, die domein-overstijgende principes, standaarden of functionaliteiten voor data delen ontwikkelen en afspreken. Nieuwe of bestaande data space initiatieven, gericht op het creëren van een data space in een bepaald domein of sector, kunnen weer principes, concepten, funties en bouwstenen adopteren van deze domein-overstijgende initiatieven.

In deze verkenning zijn de volgende data space initiatieven nader beschouwd en uiteengezet via de quick-scan analyse en bezien:

International Data Spaces (IDS);
Gaia-X;
OpenDEI;
Data Sharing Coalition;
iSHARE;
De Europese geo-informatie infrastructuur;
De Nationale geo-informatie infrastructuur.

Opzet quick-scan analyse

Als concept wordt de data space vaak beschouwd aan de hand van de wijze waarop het data delen tot stand komt. Daarvoor wordt vaak een actorenmodel geschetst met de actoren, en rollen en hun onderlinge samenhang en interacties. En onmisbaar is ook het bouwstenenmodel, dat inzicht geeft in de governance bouwstenen en meer technische bouwstenen van de data space. Voor deze verkenning is het bouwstenenmodel van OPENDEI toegepast (figuur 2.1).

Figuur 2.1 – Data space bouwstenen naar OPENDEI [[OPENDEI-DPR]]

We beschouwen een aantal ‘data space’ initiatieven, waarbij telkens een aantal elementaire aspecten en onderdelen aan de orde komen:

Domein en cross-domein typering;
Een overall referentie architectuur voor de data space;
Governance, zoals actorenmodel, afspraken(stelsel) en overeenkomsten;
Standaarden voor interoperabiliteit betreffende data (modellen en formaten), uitwissel API’s, herkomst en traceerbaarheid van data en metadata;
Voorzieningen nodig voor de vertrouwd datadelen, zoals identificatie en toegang verlenen, gebruikscontrole en vertrouwd uitwisselen (en beveiliging);
Data waarde bouwstenen, zoals catalogi, clearinghouse (logging data transacties), vocabulaires en een marktplaats (app store).
Technische infrastructuur.

Het OPENDEI model [[OPENDEI-DPR]] is toegepast in een conceptueel model (zie figuur 2.2), dat leidraad is geweest voor een quick-scan analyse waarbij verschillende data space initiatieven aan onderworpen zijn. Met dit model is de quick-scan analyse uitgevoerd naar de analogie van een eerder uitgevoerde analyse van de Data Sharing Coalition [[DSC-PP]].

Van het OPENDEI model zijn de 4 vier groepen of typeringen van de data space elementaire onderdelen overgenomen: governance, interoperabiliteit, vertrouwen en data waarde. Het OPENDEI model is niet één op één overgenomen, maar uitgebreid met enkele aanvullende onderdelen, zoals use cases / value cases en community building. De groepen interoperabiliteit, vertrouwen en data waarde krijgen daarbij een technische invulling in de vorm van ‘technische bouwstenen’ die in software implementaties tot uitdrukking komen. In hoofdstuk 5 is het OPENDEI model toegelicht en verder beschouwd.

Het (position paper) model van de Data Sharing Coalition [[DSC-PP]]) is gebruikt voor een soortgelijke analyse van vijf data space initiatieven. Van dit model is de domein en cross-domein typering overgenomen en de harde infrastructuur (technische infrastructuur). De ‘soft infrastructuur’ uit het position paper DSC is vervangen door het OpenDEI model. Uiteindelijk is ook het beschikbaar zijn van een referentie architectuur toegevoegd, omdat de referentie architectuur vaak overzicht en inzicht in de samenhang tussen de onderdelen van het betreffende data space initiatief.

Figuur 2.2 – Focus en beschouwingsgebieden data spaces van deze verkenning

Hieronder volgt een korte beschrijving van de elementaire aspecten of beschouwingsgebieden van de data spaces. Het vergelijken van de verschillende initiatieven wordt door het gebruik van verschillende begrippen(kaders) en onderdelen is niet altijd eenduidig en in sommige gevallen lastig te typeren. Vandaar dat we hieronder de elementaire onderdelen kort beschrijven zonder daarmee een eenduidige omschrijving te willen geven, We zullen daarbij tevens soortgelijke begrippen benoemen zoals die in de diverse initiatieven worden gehanteerd.

Domein en cross-domein typering

Allereerst beschouwen we de domeinen waar een data space initiatief actief is. Daarvoor zijn de negen data space domeinen, die worden onderscheiden in de Europese data strategie [[EUSD]] als uitgangspunt genomen: industrie (productie), green deal, landbouw, mobiliteit, energie, gezondheid, publieke administratie, financiën en vaardigheden (educatie). Sommige data space initiatieven richten zich op een specifiek domein, en sommige initiatieven richten zich op meerdere of op alle domeinen en zijn daarmee domein-overstijgend of cross-domein initiatieven.

Referentie architectuur

Diverse data space initiatieven hebben om te beginnen een referentie architectuur opgesteld, onder diverse noemers: “Design Principles of Data Spaces” (OPENDEI) [[OPENDEI-ARCH]], Data Sharing Canvas (Data Sharing Coalition) [[DSC-DSC]], ‘Reference Architecture Model’ (IDSA) [[IDS-RAM4]] en ‘Architecture’ (Gaia-X) [[Gaia-X-ARCH]]. De meeste van deze referentie architecturen geven een overzicht en een globale invulling van de onderdelen of bouwstenen van een data space en hoe deze bouwstenen onderling samenhangen. En worden governance bouwstenen geduid, en de data space actoren en hun functies en rollen benoemd en hun onderlinge relaties. Ook worden de interacties tussen de bouwstenen en datadeel-processen beschreven.

Governance

De governance bouwstenen voor data spaces zorgen voor de afspraken over de besturing en de actoren, de waardebepaling, de juridische en operationele overeenkomsten en community building. Het begint met zinvolle use cases.

Met de bouwsteen Use cases wordt een uitgewerkte use case of toepassing van de data space vanuit het oogpunt van de gebruiker bedoeld. Data space initiatieven werken doorgaans vanuit use cases aan de implementatie van de data space.

Het Business model / value case is de governance bouwsteen, die zich houdt met (methoden om) de waarde te schatten van data, die door de deelnemers in de data space wordt gedeeld. Veelal gaat het daarbij om het duiden van het belang van het business case of value case en/of hoe een business model kan worden opgesteld voor de data space.

Het Governance model geeft inzicht in de wijze waarop de data space bestuurd wordt. Vaak is daarvoor een besturingsmodel beschikbaar met entiteiten en hun belegde verantwoordelijkheden, taken en rollen. Een actormodel maakt daar veelal deel vanuit. Actoren in de data space zijn de deelnemers in de data space, zoals data eigenaren , data providers, data gebruikers ( en diverse intermediairs (brokers, auditors, etc..).

De bouwsteen Juridische overeenkomst omvat de verordeningen, die verwijzen naar wetten of administratieve regels, uitgevaardigd door een data space entiteit (organisatie), die worden gebruikt om het gedrag van de deelnemers aan de data space te sturen of voor te schrijven. Ook wettelijke verordeningen vallen onder de juridische overeenkomsten. Data spaces houden rekening met wetgevende vereisten, zoals de privacy wetgeving (AVG), wetgeving voor electronische identificatie (eIDAS), en betalingsverkeer in Europa (PDS2).

De bouwsteen Operationele overeenkomst beschrijft de datadiensten die door een dataprovider worden geleverd, samen met de normen waaraan de levering van de datadiensten moet voldoen. De geleverde datadiensten moeten voldoen aan gespecificeerde normen, terwijl de consument van de diensten het recht heeft om te eisen dat aan deze normen wordt voldaan. Operationale overeenkomsten zijn een soort van Service Level Agreement (SLA). Een operationele overeenkomst kan daarnaast ook op andere operationele afspraken betrekking hebben, bijvoorbeeld:

- Rapportageafspraken. Rapportages die moeten worden geproduceerd als onderdeel van de werking van de data space en in overeenstemming met de onderliggende bedrijfsmodellen. Het specificeert de indicatoren, die moeten worden geregistreerd en gerapporteerd voor elke actor en transactie van de data space;

- Factureringsafspraken. De middelen voor facturering van verleende datadiensten en transacties. In dit verband is de specificatie van het facturerings- ofheffingsschema van belang. Dit geeft aan hoe de facturering/in rekening moet worden gebracht;

- Contracten. Ze bieden een protocol voor de uitvoering van overeenkomsten tussen twee of meer partijen (voornamelijk de producent en de consument). Als zodanig specificeren ze beleid voor datagebruik, juridische aspecten, SLA's en andere overeenkomsten op een machineleesbare en cryptografisch ondertekenbare manier.

Tenslotte is Community building een belangrijke bouwsteen bij de totstandkoming van een data space. Een geharmoniseerde aanpak voor het opzetten van data spaces is eigenlijk meer een coördinatie- en schaalprobleem dan een technologisch probleem. Om data spaces in te richten, die deelnemers controle geven over hun data en met elkaar samenwerken in verschillende domeinen, is naast adequate technologie proceskennis nodig om deze te benutten. Dat betekent samenwerking, coordinatie en afstemming met alle stakeholders en deelnemers in de data space om te komen tot gemeenschappelijke en gedragen afspraken. Met Community building wordt dit proces gefaciliteerd.

Interoperabiliteit

Interoperabiliteit in data spaces moet zorgen voor de afspraken over de uitwisseling van de data. Bouwstenen die behoren tot deze categorie van data ‘interoperabiliteit’ zijn: data modellen en formaten, data uitwissel API’s, herkomst en traceerbaarheid van data en metadata.

De bouwsteen Data modellen en formaten omvat gemeenschappelijke datamodelspecificaties (of informatiemodellen) en hun syntax voor data-uitwisseling (dataformaten). In combinatie met de bouwsteen ‘Data uitwissel API’s’ zorgt dit voor de data interoperabiliteit in een data space.

De bouwsteen Data uitwissel API's vergemakkelijkt het delen en uitwisselen van data, d.w.z. dataverstrekking en (her)gebruik tussen deelnemers aan de data space via een afgesproken Application Programming Interface (API).

De bouwsteen Herkomst en traceerbaarheid van data gaat over het vastleggen van de herkomst en de tracering van data: het biedt de middelen om de totstandkoming van data (of een data product) vanuit het proces van dataverwerking,-verstrekking en -gebruik te beschrijven. Het biedt daarmee de basis voor een aantal belangrijke functies, van identificatie van de afstamming van data en het audit proof loggen van transacties tot het volgen van data producten in de verwerkingsketen van data spaces.

De bouwsteen Metadata zorgt voor de beschrijving van data producten in de data space, ook wel ‘zelfbeschrijving’ [[IDS-RAM4]] of ‘Data Asset Self-Description’ [[Gaia-X-ARCH]] genoemd. De zelfbeschrijvingen omvat een brede beschrijving van de data producten en de deelnemers in de data space alsook de publicatie- en vindmechanismen voor data producten en deelnemers. Dergelijke zelfbeschrijvingen kunnen zowel domeinoverstijgend als domeinspecifiek zijn.

Metadata is hier als onderdeel bij interoperabiliteit toegevoegd, omdat metadata zelfbeschrijvingen ook uitgewisseld moeten worden. Ook hier speelt de uitwisseling van de zelfbeschrijvingen en het bereiken van interoperabiliteit met vindvoorzieningen in data spaces . Deze bouwsteen heeft daarmee een duidelijke relatie met de bouwsteen ‘catalogus’ in de categorie data waarde. Metadata van data producten wordt geplaatst in één of meerdere data space catalogi om data producten en deelnemers in de data space vindbaar te maken.

Vertrouwen

In de categorie ‘Vertrouwen’ treffen we ook een drietal bouwstenen aan: identiteitsmanagement, toegangs- en gebruikscontrole en vertrouwde uitwisseling. Dat wordt ook wel het ‘trust framework’ of vertrouwensraamwerk genoemd in diverse data space initiatieven [[iSHARE-S]], [[DSC-DSC]], [[Gaia-X-TF]]].

Met de bouwsteen Identiteit management kunnen deelnemers, die in een data space actief zijn, worden geïdentificeerd en geverifieerd (ook authenticatie genoemd) . Het zorgt ervoor dat organisaties, personen, machines en andere actoren worden voorzien van erkende identiteiten en dat die identiteiten kunnen worden geverifieerd, met inbegrip van aanvullende informatieverstrekking, die door autorisatiemechanismen kunnen worden gebruikt om daarna toegangs- en gebruikscontrole mogelijk te maken.

De bouwsteen Toegangs- en gebruikscontrole garandeert de handhaving van het beleid inzake datatoegang en -gebruik dat is gedefinieerd als onderdeel van de algemene voorwaarden, die zijn vastgesteld wanneer data producten worden gepubliceerd of waarover wordt onderhandeld tussen de data producenten en consumenten. Een data producten- en/of data provider implementeert doorgaans mechanismen voor datatoegangsbeheer om misbruik van haar data te voorkomen, terwijl controlemechanismen voor datagebruik meestal worden geïmplementeerd aan de kant van de consument om misbruik van data te voorkomen. Dit wordt ook ‘autorisatie’ genoemd. In complexe datawaardeketens worden beide mechanismen gecombineerd door ‘prosumenten’. Toegangscontrole en gebruikscontrole zijn afhankelijk van identificatie en authenticatie.

De derde bouwsteen Vertrouwd uitwisselen vergemakkelijkt de vertrouwde data-uitwisseling tussen deelnemers en stelt de deelnemers aan een data-uitwisseling gerust dat andere deelnemers echt zijn wie ze beweren te zijn en dat ze voldoen aan de gemaakte afspraken van de data space. Dit kan enerzijds worden bereikt door organisatorische maatregelen, zoals het werken met certificering en certificaten of door geverifieerde referenties en anderzijds door eventuele technische maatregelen.

Data waarde

In de categorie data waarde wordt de waarde van de data space zichtbaar voor de deelnemers van de data space. Vier bouwstenen worden onderscheiden: een catalogus voor het vindbaar maken van dataproducten en deelnemers, een clearinghouse om transacties vast te leggen, een bibliotheek met een overzicht van de semantiek van de data(producten), en een marktplaats om vragers en aanbieders van data en data producten bij elkaar te brengen.

De bouwsteen Catalogus bevat de publicatie- en vindmechanismen voor data producten en deelnemers aan de data space, waarbij gebruik wordt gemaakt van de algemene zelfbeschrijvingen (metadata) van data en deelnemers aan de data space. Voor de catalogus worden verschillende termen gebruikt, zoals ‘metadata discovery’ (OPENDEI) [[OPENDEI-DPR]], ‘meta data broker’ (IDS) [[IDS-MDB]] en ‘Federated Catalogue’ (Gaia-X) [[Gaia-X-ARCH]]. Daarmee heeft deze bouwsteen een duidelijk relatie met de interoperabiliteit bouwsteen ‘metadata’. Catalogi werken ook samen en bieden mogelijkheden om elkaars metadata te oogsten en uit te wisselen. Ook hierbij spelen afspraken en standaarden een belangrijke rol.

De bouwsteen Clearinghouse vormt de basis voor vastlegging van de transacties, die de toegang tot en/of gebruik van data door verschillende gebruikers vastleggen (de loggingsfunctie). In OPENDEI heet deze bouwsteen ‘accounting van datagebruik’ [[OPENDEI-DPR]] en in IDS ‘clearing house functies’ [[IDS-CH]]. Het clearinghouse ondersteunt naast monitoring en logging belangrijke functies voor het vastleggen van clearing, betaling en facturering, inclusief transacties voor het delen van data zonder de betrokkenheid van de marktplaats.

De bouwsteen Vocabularies, Thesauri en Registers zorgt voor de semantische samenhang en afstemming via het vastleggen van de semantiek in de data space. Hiervoor worden de verschillende begrippen afkomstig van vnl. data modellen (informatiemodellen) van de data space vastgelegd en beschikbaar gesteld via federatieve diensten. In IDS wordt deze rol de vocabulaire-provider genoemd en het platform waar gemeenschappen gedeelde vocabulaires publiceren en onderhouden, wordt de ‘vocabulary hub’ genoemd [[IDS-RAM4]]. Andere aanduidingen hiervoor zijn begrippenlijsten, conceptenbibliotheken, taxonomien, thesauri en semantische registers en ontologien. Ook hier speelt een vindvoorziening een rol.

De bouwsteen Marktplaats omvat het online aanbieden van data producten aan de deelnemers onder gedefinieerde voorwaarden Deze bouwsteen ondersteunt de publicatie van aanbiedingen, het beheer van processen die verband houden met het maken en monitoren van slimme contracten (die de rechten en plichten voor datagebruik duidelijk beschrijven) en regelt toegang tot data producten. In IDS wordt deze bouwsteen ‘App store’ genoemd [[IDS-RAM4]]. Deze bouwsteen ondersteunt daardoor ook de uitbreiding van data spaces met meer data producten en deelnemers.

Technische infrastructuur

De in de vorige paragrafen beschreven bouwstenen in het OPENDEI model worden ook wel aangeduid met ‘zachte infrastructuur’. Met de technische infrastructuur wordt hier bedoeld de ‘harde’ infastructuur bestaande uit de hardware en bijbehorende software om interoperabiliteit, connectiviteit en overdraagbaarheid in een data space te creëren. Denk daarbij aan aspecten van data opslag, cloud en edge service providing en netwerkconnectiviteit. Data space initiatieven laten de inrichting van de infrastructuur over aan de infrastructuur providers markt en blijven daarmee onafhankelijk en kunnen leveren aan meerdere infrastructuur platforms.

International Data Spaces

Dit hoofdstuk beschrijft en introduceert het gebruik van het concept ‘data space’ vanuit het perspectief van de International Data Spaces. Naast een korte introductie beschrijven we de essentiële en ondersteunende bouwstenen van de International Data Spaces. De afspraken over het data delen komen globaal aan de orde en het actorenmodel worden kort benoemd.

International Data Spaces

International Data Spaces (IDS) is op een missie om de toekomst van de wereldwijde, digitale economie te creëren, een veilig, soeverein systeem voor het delen van data waarin alle deelnemers de volledige waarde van hun data kunnen realiseren. IDS maakt het mogelijk om nieuwe ‘’slimme diensten en innovatieve bedrijfsprocessen in verschillende ‘sectoren en industrieën te laten werken, terwijl ervoor wordt gezorgd dat de zelfbepaalde controle over data gebruik in handen blijft van data eigenaren (datasoevereiniteit). Aldus IDS.

In oktober 2015 initieerde de Fraunhofer Society het International Data Spaces (IDS) project, voorheen Industrial Data Space, gefinancierd door het Duitse federale ministerie van Onderwijs en Onderzoek. IDS wordt ondersteund door de non-profitorganisatie International Data Spaces Association (IDSA), die actief bijdraagt. In 2022 bestaat de IDSA uit 138 leden van over de hele wereld, die samen de IDS-standaard voor datasoevereiniteit definiëren. De leden van de IDSA komen uit verschillende industrieën en bieden use cases waarbij de IDS-architectuur wordt toegepast in hun overeenkomstige domein.

IDS heeft daarmee mede tot doel een data-gedreven economie te creeren door de blauwdruk te bieden voor veilige, data-uitwisseling tussen partners die elkaar vertrouwen. Dit is wat wordt aangeduid met ‘dataoevereiniteit’. Data-soevereiniteit is van vitaal belang in het licht van het feit dat gegevenstoegang en -uitwisseling kritieke succesfactoren worden voor zowel bedrijven, overheid en particulieren. IDS heeft een referentie architectuur en een reeks overeenkomsten gedefinieerd die kunnen worden gebruikt om data spaces te creëren die vertrouwen tussen partners garanderen en een basis bieden voor innovatieve, nieuwe bedrijfsmodellen, data producten en diensten.

IDS bouwstenen voor data delen

IDSA definieert standaarden en specificaties voor datasoevereiniteit. Deze standaarden en specificaties beschrijven de technische basis, te gebruiken standaarden en afspraken nodig voor soeverein, vertrouwd en veilig data delen. In het IDS Regelboek [[IDS-PPRB]] is een overzicht opgenomen met globale activiteiten van IDS (figuur 3.1). Allereerst kent IDS organisatorisch gezien drie onderdelen.

Figuur 3.1 – Globale overzicht van de IDS organisatie [[IDS-PPRB]]

Om ervoor te zorgen dat de toekomstige data-economie soepel functioneert en zijn waardepropositie waarmaakt, moeten alle spelers zich houden aan een gemeenschappelijk governancekader dat de functionele, technische, operationele en juridische overeenkomsten specificeert die hun rollen en interacties binnen en tussen de verschillende delen van het ecosysteem structureren. Dit boek met regels en richtlijnen schetst dat kader [[IDS-PPRB]]. Door deze regels en richtlijnen te volgen, kunnen alle spelers samenwerken om het gedeelde doel te bereiken om de volledige waarde van de wereldwijde data-economie te ontsluiten.

De IDS-ondersteuningsorganisatie is verantwoordelijk voor het bijhouden van het regelboek en voor het ondersteunen van de toepassing ervan. De IDS-ondersteuningsorganisatie helpt bij het coördineren van belangrijke processen en als algemeen bestuur een basis voor de realisatie van interne structuren en interfaces met andere partijen.

Daarnaast bestaat het IDS Open Source project, dat de software componenten ontwikkeld voor het implementateren en testen van de essentiele IDS componenten.

De belangrijke actoren en bouwstenen van een IDS data space zijn in onderstaande figuur 3.2 weergegeven.

Figuur 3.2 - IDS bouwstenen voor data-uitwisseling (bron: IDS infographic)

De data provider is een ‘apparaat’, dat de data van de eigenaar overdraagt via de IDS connector naar de data space. Het stelt anderen in staat om de data te gebruiken met behoud van controle over de data: het wie, hoe, wanneer, waarom en tegen welke prijs. Dat is datasoevereiniteit, de basis voor het ontsluiten van de waarde van data. Dat wordt vastgelegd in ‘usage policies’.

De data consument is een ‘apparaat’, dat de data van de eigenaar via de IDS connector opvraagt en gebruikt in de data space.

De IDS connector is een softwarecomponent waarmee de deelnemers gebruiksbeleid kunnen koppelen aan hun data in een data space, het gebruiksbeleid kunnen afdwingen en naadloos de herkomst van de data kunnen volgen. De IDS connector fungeert als gateway voor data en diensten en als vertrouwde omgeving voor Apps en software. Apps voeren taken uit zoals transacties, aggregaties of analyse van de data.

De IDS connector is de centrale technische component voor veilige en vertrouwde data-uitwisseling. De connector verzendt data rechtstreeks naar de ontvanger in een vertrouwde, gecertificeerde data space, zodat de oorspronkelijke dataprovider altijd de controle over de data behoudt en de voorwaarden voor het gebruik ervan bepaalt. De IDS connector maakt gebruik van technologie die de data in een soort virtuele "container" plaatst, die ervoor zorgt dat deze alleen worden gebruikt zoals overeengekomen volgens de voorwaarden die door de betrokken partijen zijn vastgesteld.

IDS connectors kunnen de beschrijving van hun data producten (en eindpunten) publiceren bij een broker of makelaar. Hierdoor kunnen potentiële data consumenten beschikbare data producten vinden in termen van content, structuur, kwaliteit, actualiteit en andere attributen. Met hetzelfde doel, het vinden en gebruiken van de data producten, beheren vocabulaireproviders een vocabulary, die wordt gebruikt om data producten te annoteren en te beschrijven (inclusief ontologieën, referentie data modellen, metadata-elementen). Vocabulaireproviders leveren deze (domein-specifieke) vocabulaires en hun verwijzingen naar het IDS informatiemodel, dat de basis vormt voor de beschrijving van data producten.

Het clearing house biedt indien nodig decentrale en controleerbare traceerbaarheid van alle transacties in de data space. Daarnaast biedt deze faciliteit clearing- en afwikkelingsdiensten voor alle financiële en data-uitwisselingstransacties binnen de data space. Het is de ‘verrekenkamer’.

App stores bieden data-apps aan. Apps zijn toepassingen die kunnen worden geïmplementeerd in IDS Connectors om taken zoals transformatie, aggregatie of analyse van de data uit te voeren. Data-apps kunnen worden gecertificeerd door IDS goedgekeurde certificeringsinstanties.

De identiteit providers bieden een scala aan diensten voor het maken, onderhouden, beheren en valideren van identiteitsinformatie van en voor alle deelnemers. Collectief vertrouwen in de bewijsbare identiteit van alle deelnemers is noodzakelijk voor het succesvol functioneren van op IDS gebaseerde data spaces.

IDS referentie architectuur

De IDS Referentie architectuur ([[IDS-RAM3]], [[IDS-RAM4]]) beschrijft de logische samenhang van IDS als data space in vijf lagen:

De businesslaag beschrijft de actoren, hun rollen en interacties. Daarbij wordt eveneens aandacht besteed aan het belang van ‘identiteiten’ vastleggen en gebruikscontracten voor het uitwisselen van data;
De functionele laag onderscheidt de functionele aspecten van IDS in zes categorieën: vertrouwen, veiligheid en datasoevereiniteit, het ecosysteem van data, de interoperabiliteit, value-addings apps en de data markt;
De proceslaag beschrijft in hoofdlijnen de belangrijke processen van IDS: het proces van ‘onboarding’ in de data space, het data-uitwisselingsproces en proces van het publiceren, gebruiken en certificeren van data apps. Voor deze processen zijn standaard procesmodellen beschikbaar;
De informatielaag specificeert het informatiemodel, de domeinonafhankelijke, gemeenschappelijke taal van de IDS data space;
Op de systeemlaag wordt aandacht besteed aan de data connector, en zijn werking in het systeem van data apps en data marktplaats.

Bij de vijf architectuurlagen worden drie perspectieven beschreven: het perspectief van de beveiliging, de certificering en de besturing (‘governance’). In onderlinge samenhang levert dit een geheel op aan componenten, processen en besturingsaspecten voor IDS. IDS is daarmee geen data space, maar een kader om data spaces in te richten. We lichten de informatielaag hieronder kort toe.

Het IDS informatiemodel

Een belangrijk onderdeel van de IDS informatielaag is het IDS informatiemodel [[IDS-IM]]. Het informatiemodel bevat alle aspecten die een rol spelen in de data space, hun definities en onderlinge relaties. Het informatiemodel ondersteunt de beschrijving, publicatie en identificatie van dataproducten en herbruikbare dataverwerkingssoftware, beiden in IDS "digital resources’ of eenvoudigweg ’resources’ of bronnen genoemd. Zodra de relevante bronnen zijn geïdentificeerd, kunnen ze worden uitgewisseld en geconsumeerd via semantisch geannoteerde, gemakkelijk vindbare diensten.

Een belangrijk onderdeel in IDS is de uitwerking van het concept van de ‘digital resource’. Een digital resource “is a uniquely identifiable, valuable, digital (i.e. non-physical) commodity that can be traded and exchanged between remote participants using the IDS infrastructure” [[IDS-RAM3]] [[IDS-RAM4]]. Een digitale bron wordt in een data space nauwkeurig beschreven. Door een nauwkeurige beschrijving van de digitale bron worden de dataconsumenten eenduidig geïnformeerd voor doelgericht gebruik van de bron en worden misverstanden voorkomen. Dat betekent dat digitale bronnen door de dataproductleveranciers van een adequate beschrijving wordt voorzien.

De beschrijving omvat minimaal 6 categorieën van aandacht of ’de concerns’ (zie figuur 3.3).:

Content betreft de algemene beschrijving van het data product, type data product, dataformaat, datavoorbeeld en de fysieke omvang van het data product;
Context betreft een beschrijving van de entiteit, de locatie (zoals coördinaat referentiesysteem) en de tijdcomponent (geldigheid, creatiedatum);
Concept, zoals beschrijving van begrippen, sleutelwoorden en typen entiteiten uit schema’s en ontologie;
Communicatie, zoals wijze van ontsluiting met data uitwissel API’s;
Commodity of gemeengoed, zoals kwaliteitsaspecten, provenance of lineage , beleid en beprijzing van bronnen;
Community of Trust, dat zorgt voor en veilige en soevereine uitwisseling van digitale bronnen tussen consumenten en producten en/of leveranciers.

De digitale bron kan alleen geleverd worden na afronding van een dialoog tussen consument en dataleverancier. Denk aan: de aanvraag van de dienst door de afnemer, de wedervraag van de dienstverlener om meer informatie en het antwoord daarop. Deze dialoog stelt voorwaarden aan de afnemer. De afnemer moet de beschrijving van deze dialoog begrijpen, wil hij aan de voorwaarden kunnen voldoen.

Figuur 3.3 – Concernsmodel voor IDS ‘resources’ [[IDS-RAM4]]

Van informatieconcept naar implementatie

Naast de conceptuele weergave van het informatiemodel in de IDS referentie architectuur is ook de declaratieve en programmatische weergave van belang om tot de implementatie van een digitale bron en de diverse IDS bouwstenen te komen (zie figuur 3.4).

De conceptuele weergave of representatie van het informatiemodel biedt een overzicht op hoog niveau van de belangrijkste, grotendeels invariante concepten, zonder verplichting tot een bepaalde technologie of domein. Het richt zich op een algemeen publiek, omdat het basisinformatie biedt en een gedeeld begrip van de concepten bevordert door middel van een textueel document en een visuele notatie. Indien beschikbaar, verwijst IDS ook naar gerelateerde elementen van de declaratieve weergave en een programmatische weergave, waardoor wordt aangemoedigd om naar deze alternatieve implementaties te kijken.

De declaratieve weergave heet ‘IDS Ontology’ en geeft een normatief beeld van het IDS informatiemodel. Het is ontwikkeld op basis van de analyse, bevindingen en vereisten van de conceptuele representatie. Op basis van W3C Semantic Web-technologiestandaarden zoals DCAT, PROV en ODRL, biedt het een formele, machinaal interpreteerbare specificatie van concepten die door de conceptuele weergave worden beoogd. Bovendien beschrijft en definieert het formeel entiteiten van de IDS om de gestructureerde metadata van deze entiteiten te kunnen delen, zoeken en beredeneren. De IDS Ontology wordt meestal gebruikt en geïnstantieerd door kennisingenieurs, ontologie-experts of informatiearchitecten. In de praktijk worden bestaande domeinvocabulaires en -normen waar mogelijk hergebruikt, waardoor acceptatie en interoperabiliteit worden bevorderd.

Figuur 3.4 – Weergaven van het IDS informatiemodel [[IDS-RAM4]]

Als laatste richt de programmatische weergave van het informatiemodel zich op softwareleveranciers die het informatiemodel implementeren in software. De programmatische weergave biedt de best-effort mapping van de IDS Ontology op de native structuren van een doelprogrammeertaal (bijv. Java, Python, C ++). Het stelt software ontwikkelaars in staat om eenvoudig instanties van het informatiemodel te maken die voldoen aan de IDS Ontology. IDS heeft voor de programmatische weergave al diverse technische bouwstenen beschikbaar. Deze IDS componenten, zoals een data connector of metadata broker, kunnen opnieuw gebouwd worden door bestaande bronnen als sjabloon te gebruiken, of zijn via bestaande open source componenten te (her)gebruiken.

Een transparant certificeringsproces zorgt voor vertrouwen van deelnemers en componenten binnen de data space. IDS maakt betrouwbare data-uitwisseling mogelijk tussen gecertificeerde data-aanbieders en -ontvangers, op basis van onderling overeengekomen regels.

Synthese

IDS is in Europa een breed gedragen initiatief voor het creëren van data spaces. Het IDS-raamwerk en het IDS Reference Architecture Model [[IDS-RAM4]] vormen een integraal onderdeel van de EU Data Strategie. De rol van IDS voor de EU data strategie is beschreven in dit white paper.

IDS richt zich op standaarden en specificaties voor cross-domein data spaces. De IDS referentie architectuur [[IDS-RAM4]] beschrijft de logische samenhang van de verschillende aspecten van een data space; van actoren en hun rollen, functionele aspecten en bouwstenen, de cruciale processen, de informatielaag met beschrijving van de digitale bronnen , tot en met de systeemlaag met data connectors. In diverse gepubliceerde documenten worden onderdelen van de referentie architectuur verder uitgewerkt. De focusgebieden van IDS zijn in figuur 3.5 weergegeven.

Om te beginnen is IDS een generiek cross-domein referentie model voor data spaces, zonder binding aan een bepaald toepassingsdomein.

In diverse use cases is de werking van IDS bouwstenen beproefd. In een position paper [[IDS-PPBM]] wordt een methode aangeboden om de business model en value case van de data space vast te stellen. IDS kent geen governance model voor data spaces, de referentie architectuur heeft wel de actoren en rollen van een data space vastgelegd. Een bijbehorende governance model voor de data space wordt aan de deelnemers van de domein-specifieke data space overgelaten. Diverse use cases illustreren het gebruik van IDS.

Figuur 3.5 - Focusgebieden IDS als data space initiatief

Wat betreft de interoperabiliteit biedt het IDS informatiemodel geen meta-model voor het definiëren van data of uitwissel API’s. De domeinmodellering is doorgaans gebaseerd op gedeelde vocabulaires en schema's, zoals bijvoorbeeld verstrekt door domein-specifieke gemeenschappen. Dat is aan de domein-specifieke gemeenschappen gelaten en is geen onderdeel van IDS. Interoperabiliteit is uitgewerkt in de vorm van de metadata en de data connector. Ook is geen of nauwelijks aandacht besteed aan herkomst en traceerbaarheid, anders dan dat de beschrijving van de digitale bronnen ook de herkomst meegenomen moet worden. Daarmee is herkomst onderdeel van het informatiemodel.

Voor het aspect vertrouwen heeft IDS aspecten in het informatiemodel uitgewerkt. In enkele position papers wordt globaal inzicht geven in de werking van bijvoorbeeld ’usage control’ [[IDS-PPUC]] en ‘certificering [[IDS-PPCE]].

Voor enkele van de vier bouwstenen catalogus [[IDS-MDB]], clearinghouse [[IDS-CH]], vocabulaires en marktplaats zijn eveneens specificaties opgesteld en uitgewerkt.

Op de systeemlaag worden de rollen, die op de businesslaag zijn gespecificeerd, toegewezen aan een concrete data- en servicearchitectuur om te voldoen aan de vereisten die zijn gespecificeerd op de functionele laag; de technische kern van de IDS. Uit de vereisten die aan de functionele laag zijn geïdentificeerd, resulteren drie belangrijke technische componenten: de connector, de metadata broker [[IDS-MDB]] en de App Store. Dit zijn duidelijke IDS focusgebieden, die respectievelijk verwijzen naar bouwstenen metadata, de catalogus (metadata discovery) en de marktplaats. De connector, metadata broker en App Store worden ondersteund door extra componenten, die niet specifiek zijn voor IDS, maar wel zijn gespecificeerd door IDS [[IDS-RAM4]]:

de Identity Provider (vanuit het perspectief van de beveiliging);
de Vocabulary Hub (zoals momenteel gedefinieerd buiten IDS);
de Update Repository (d.w.z. de bron voor updates van de aanwezige connectors) afhankelijk van de toegepaste connectortechnologie;
de Trust Repository.

Ook kent IDS open source software implementaties, die momenteel voornamelijk beschouwd worden als referentie implementaties. En zo zijn diverse implementaties voor de IDS connector beschikbaar [[IDS-DC]].

De IDSA Data Space Radar is het platform voor het vinden van IDS data space use cases.. De radar behandelt use cases van verschillende gradaties van volwassenheid, van de fase van het maken van een business case tot ‘echte’ data spaces; van gepland tot pilot tot volledig operationeel, in verschillende sectoren en functionele domeinen.

Gaia-X

Dit hoofdstuk introduceert het concept ‘data space’ vanuit het perspectief van de Gaia-X als ‘verbinder tussen eco-systemen’. Naast een korte introductie beschrijven we de functionele bouwstenen en onderscheiden federatieve diensten van Gaia-X. De afspraken over interoperabiliteit en standaarden voor data delen komt aan de orde en het actorenmodel worden benoemd. En we staan even stil bij de positionering van Gaia-X ten opzichte van het in het vorig hoofdstuk geïntroduceerde IDS initiatief.

Gaia-X als verbinder tussen ecosystemen

Gaia-X is een Europees initiatief, dat een softwareraamwerk van controle en governance ontwikkelt en een gemeenschappelijke reeks van beleidsregels implementeert. Deze kunnen worden toegepast op elke bestaande cloud / edge-technologiestack om transparantie, controleerbaarheid, portabiliteit en interoperabiliteit tussen data en diensten te verkrijgen. Het raamwerk is bedoeld om te worden geïmplementeerd bovenop elk bestaand cloudplatform. Gaia-X is geen marktexploitant en zal ook geen van de door het raamwerk vereiste diensten rechtstreeks of uitsluitend exploiteren. Gaia-X-diensten zullen worden gecreëerd, geëxploiteerd en geadopteerd door markt exploitanten, die besluiten de Gaia-X-standaard te adopteren.

De naam van het project Gaia-X komt overeen met de hoge ambities, vernoemd naar de Griekse aardgodin Gaia, die één van de eerste godheden was die uit de chaos kwam. Gaia-X is bedoeld om een orde te scheppen in de digitale economie in Europa en heeft drie doelstellingen:

Datasoevereiniteit. Europese bedrijven en organisaties moeten altijd de keuze hebben waar en bij wie ze data opslaan en verwerken en waar ze digitale diensten afnemen. Gaia-X wil monopolies en daarmee een eenzijdige afhankelijkheid van Europa van grote niet-Europese platformaanbieders voorkomen. Met name kleine en middelgrote ondernemingen moeten kunnen profiteren van de transparantie van de markt, eenvoudige toegang tot diensten en aanbiedingen op maat;
Beschikbaarheid van data. Wanneer data de belangrijkste grondstof worden, hebben Europese bedrijven, overheden, instellingen en burgers garanties nodig om data op een betrouwbare, veilige en transparante manier uit te wisselen. Zelfs wanneer deze data door vele handen, systemen en fasen gaan;
Innovatie. Gaia-X is bedoeld om innovatie in Europa te bevorderen en de digitale economie te versterken. De cloud en edge services die onder Gaia-X zijn verzameld, ondersteunen de digitale bedrijfsmodellen van het Europese bedrijfsleven en geeft deze de mogelijkheid om op basis van deze infrastructuur wereldwijd te groeien.

Gaia-X onderschrijft als data space concept de volgende eigenschappen:

Een data space is een data-integratie concept, waarbij geen fysieke integratie van data plaats heeft, maar data federatief (of gedistribueerd) wordt aangeboden;
Het data space concept kent geen gezamenlijk semantische data schema, maar werkt met vocabulaires;
Er is geen ‘single source of truth’, data kan vaker voorkomen in een data space (data kan redundant aanwezig zijn);
Binnen een data space kunnen weer data spaces bestaan (geneste data spaces);
Een data space is nooit af, en evolueert in de tijd;
In data spaces staat data soevereiniteit centraal; de eigenaar van data wil weten wat er met zijn data gebeurt;
In een data space is altijd sprake van een vertrouwensrelatie tussen aanbieder en afnemer, (via een token).

Gaia-X wordt gezien als een standaard, die data-uitwisseling mogelijk maakt in en tussen data spaces oftewel ‘Gaia-X ecosystemen’. Een Gaia-X ecosysteem is een organiserend principe, dat de interactie van verschillende actoren en hun omgeving beschrijft als een geïntegreerd geheel, zoals in een biologisch ecosysteem. In een technische context verwijst het naar een reeks losjes gekoppelde actoren, die gezamenlijk een economische gemeenschap vormen. Gaia-X maakt onderscheid in een ‘Data Ecosysteem’ en een ‘Infrastructuur Ecosysteem’, elk met een andere focus op uitgewisselde data en diensten (zie figuur 3.1).

Figuur 3.1 – Het Gaia-X ecosysteem [[Gaia-X-ARCH]]

Ondanks dat het data en infrastructuur ecosysteem een afzonderlijke focus heeft, kunnen ze niet afzonderlijk worden bekeken omdat ze op elkaar voortbouwen en complementair zijn. Het Gaia-X ecosysteem bestaat uit het geheel van alle individuele ecosystemen die de Gaia-X architectuur gebruiken en voldoen aan de Gaia-X eisen. Er kunnen verschillende individuele ecosystemen bestaan (bijv. Catena-X in de automobielsector), die zichzelf orkestreren, de architectuur gebruiken en al dan niet de (open source) software van de Gaia-X federatieve diensten gebruiken.

Verder kent Gaia-X vier typen participanten: de providers, consumenten, de ‘provider en consument’ en enkele federators. De federators verschijnen als verbindingslaag tussen providers en consumenten, die de diverse federatiediensten aanbieden. Federatiediensten bieden verbindingen tussen de verschillende providers en consumenten of tussen de verschillende ecosystemen. Consumenten kunnen ook als aanbieders optreden door samengestelde diensten of verwerkte data aan te bieden via de federatieve catalogi.

De belangrijke drie assets zijn ‘data assets’ in het data ecosysteem, de ‘nodes’ in de infrastructuur ecosysteem en de ‘software assets’ als interconnectie tussen beiden.

Governance in Gaia-X omvat de beleidsregels, die invulling geven aan de doelstellingen, regels, praktijken of voorschriften van alle activiteiten van de deelnemers binnen het ecosysteem. Om met Gaia-X een hoger en ongekend niveau van vertrouwen in digitale platforms te garanderen, heeft Gaia-X een ‘Trust Framework’ ontwikkeld - voorheen bekend als Gaia-X Compliance and Labelling Framework - dat gegevensbescherming, transparantie, beveiliging, overdraagbaarheid en flexibiliteit voor het ecosysteem waarborgt, evenals soevereiniteit en Europese controle. Het Gaia-X vertrouwensraamwerk [[Gaia-X-TF]] is de set regels, die de minimale basis definiëren om deel uit te maken van het Gaia-X ecosysteem. Deze regels zorgen voor een gemeenschappelijk bestuur (de governance) en de basisniveaus van interoperabiliteit tussen de individuele ecosystemen. Met andere woorden, het Gaia-X ecosysteem bestaat uit deelnemers en diensten, die de Gaia-X vereisten van het vertrouwensraamwerk volgen. Het vertrouwensraamwerk maakt gebruik van verifieerbare referenties (‘credentials’) en een linked data representatie. De set berekenbare regels, die bekend staat als het nalevingsproces (‘compliance process’) is geautomatiseerd en geverifieerd.

Gaia-X actoren en federatieve diensten

In het huidige Gaia-X architectuur [[Gaia-X-ARCH]], is het conceptueel model opgenomen met alle concepten in het kader van Gaia-X en de relaties daartussen (zie figuur 3.2). Het bovenste deel van het model toont verschillende actoren van Gaia-X, terwijl het onderste deel de relatie met actoren buiten Gaia-X toont. Het algemene interactiepatroon tussen de actoren wordt ook beschreven in [[Gaia-X-ARCH]]. Een Gaia-X participant of deelnemer kan één of meer van de volgende rollen op zich nemen: Provider, Consument of Federator. Provider en consument representeren de kernrollen, terwijl de federator hun interactie(s) mogelijk maakt. Een provider is een deelnemer die middelen of ‘resources’ exploiteert in het Gaia-X ecosysteem en deze als diensten aanbiedt. Voor een dergelijke dienst definieert de provider het dienstenaanbod inclusief algemene voorwaarden en technisch beleid meteen zelfbeschrijving (en het bijbehorende beleid). Federators zijn verantwoordelijk voor het aanbieden van federatieve diensten. Er kunnen één of meer federators per type dienst zijn.

Een consument is een deelnemer, die datadiensten zoekt en diensten) gebruikt in het Gaia-X ecosysteem. Alle deelnemers in Gaia-X hebben een zelfbeschrijving. Dit zijn ook de belangrijke kernbegrippen in de vorm van verplichte attributen voor Gaia-X zelfbeschrijvingen, die zijn gespecificeerd in het Gaia-X Trust Framework [[Gaia-X-TF]].

Figuur 3.2 – Gaia-X conceptueel model [[Gaia-X-TF]]

De Gaia-X Federatieve Diensten [[Gaia-X-FSS]] zijn diensten, die nodig zijn voor de operationele implementatie van een Gaia-X data ecosysteem mogelijk te maken. Gaia-X onderscheidt vier groepen federatieve diensten, die nodig zijn om federatie van ‘resources’, deelnemers en interacties tussen ecosystemen mogelijk te maken. Het gaat om vier groepen federatieve diensten, gericht op identiteit en vertrouwen, compliance services voor soevereine data-uitwisseling en een federatieve catalogus waarin zelfbeschrijvingen van de deelnemende organisaties en hun diensten zijn opgenomen.

De Gaia-X gemeenschap ontwikkelt ook open-source softwarecomponenten voor de Gaia-X federatieve diensten. Deze open-source softwarecomponenten zijn beschikbaar voor iedereen en kunnen direct worden ingezet of als inspiratie dienen voor eigen ontwikkelingen. De federatieve diensten [[Gaia-X-FSS]] vertegenwoordigen de minimale technische vereisten, die nodig zijn om een Gaia-X ecosysteem op te zetten en te exploiteren. Op basis van technische specificaties worden de federatieve diensten op basis van open source code ontwikkeld. Dit staat ook bekend als de GXFS Toolbox. Op Gitlab [[Gaia-X-G]] is de open source code van de implementatie van diverse Gaia-X federatieve diensten te vinden.

Synthese

Gaia-X is een Europees data space initiatief. Gaia-X richt zich op standaarden en specificaties voor cross-domein data spaces. Gaia-X kent een referentie architectuur [[Gaia-X-ARCH]], die de logische samenhang beschrijft van de verschillende concepten van een Gaia-X data space; van actoren en hun rollen, de functionele aspecten en bouwstenen in de vorm van federatieve diensten , de definitie van de zelfbeschrijving van bronnen en het vertrouwensraamwerk met ‘trust anchors’, ‘policy rules’ en ‘labels. In diverse gepubliceerde documenten worden onderdelen van de referentie architectuur verder uitgewerkt. De focusgebieden van Gaia-X zijn in figuur 3.3 opgenomen.

In diverse use cases in uiteenlopende toepassingsdomeinen wordt de werking van een Gaia-X data space toegelicht. In diverse Gaia-X ‘lighthouse projecten’ wordt de werking van de Gaia-X bouwstenen inmiddels beproefd, zoals Catena-X voor de automobielindustrie, Agdatahub voor de agri-business en in Mobility Data Space voor het mobiliteitsdomein.

Gaia-X heeft een actormodel , waarin de actoren en hun rollen globaal zijn benoemd. Invulling van de actoren vindt plaats bij de implementatie van de data space. Daarnaast kent Gaia-X een governancemodel, waarin de Gaia-X een belangrijke rol speelt. Veel is er echter nog niet bekend over de wijze waarop de Gaia-X data space worden bestuurd.

Community building is een belangrijke organisatorische pilaar van Gaia-X. Gaia-X is een gemeenschappelijk Europees project: het brengt mensen van verschillende bedrijven, onderzoeksinstellingen, verenigingen, overheden en politiek samen om te werken aan een gemeenschappelijk doel. Samen bouwen ze voort op het breedste spectrum van expertise om de toekomst van de digitale infrastructuur voor Europa te co-creëren - in speciale data spaces die de meest kritieke ‘industrieën’ bedienen. De organisatiestructuur van Gaia-X is gebouwd op drie pijlers: de Gaia-X Association, de nationale Gaia-X Hubs en de Gaia-X Gemeenschap. Daarbinnen zijn er verschillende werkgroepen en commissies. De uitwisseling binnen, tussen en buiten deze pijlers naar andere belanghebbenden (bijv. Europese Commissie, internationale initiatieven) wordt gewaarborgd.

Figuur 3.3 - Focusgebieden Gaia-X als data space initiatief

Wat betreft de interoperabiliteit biedt het Gaia-X geen meta-model voor het definiëren van data of uitwissel API’s. De domeinmodellering is doorgaans gebaseerd op gedeelde vocabulaires en schema's, zoals bijvoorbeeld verstrekt door domeinspecifieke gemeenschappen. Dat is aan de domeinspecifieke gemeenschappen gelaten en is geen onderdeel van Gaia-X. Interoperabiliteit is uitgewerkt in de vorm van de zelfbeschrijving (metadata)van de ‘resources’. Ook is aan geen of nauwelijks aandacht besteed aan ‘provenance’ en ‘tracebility’. De zelfbeschrijving is vooral de waarborg voor de vertrouwd en soeverein uitwisselen van data en kan door domeinspecifieke data space initiatieven ook aangepast worden.

Voor het aspect vertrouwen heeft Gaia-X diverse aspecten in de architectuur uitgewerkt en zijn eveneens technische specificaties beschikbaar. De technische specificaties geven daarbij in detail inzicht in de functionele en niet-functionele aspecten van diverse benodigde componenten. Voor de bouwstenen catalogus, clearinghouse en marktplaats zijn technische specificaties voor de ‘Federation Services’ [[Gaia-X-FSS]] opgesteld en uitgewerkt zoals de ‘Federated Catalogue’ [[Gaia-X-FC]], de ‘Data Exchange Logging Service’, ‘Continous Automated Monitoring’ en de ‘Portal’. Ook zijn voor verschillende ondersteunende componenten technische specificaties opgesteld: de ‘Personal Credential Manager’, de ‘Organizational Credential Manager’ en Services API. Van een deel van de technische specificaties zijn implementaties beschikbaar. De beschikbare (open source) software componenten (referentie implementaties) zijn terug te vinden op Gitlab [[Gaia-X-G]].

OpenDEI

Inleiding

OPENDEI heeft tot doel lacunes op te sporen, synergiën aan te moedigen, regionale en nationale samenwerking te ondersteunen, en de communicatie tussen de EU-projecten ter uitvoering van de digitale strategie van de EU te verbeteren. Belangrijke producten van dit EU project zijn het position paper ‘Design principles for data spaces’ [[OPENDEI-DPR]] en de OpenDEI vergelijking van referentie-architecturen voor data spaces [[OPENDEI-ARCH]].

OpenDEI heeft het position paper ‘Design principles for data spaces’ opgeleverd in mei 2021 [[OPENDEI-DPR]]. Aan het OpenDEI position paper hebben diverse andere data space initiatieven en organisaties een bijdrage geleverd, zoals IDSA en Gaia-X. In het position paper beschrijft OPENDEI de principes voor het maken van data spaces en een conceptueel model van de nodige afspraken en generieke bouwstenen. OpenDEI heeft daarvoor een kader voor de ‘zachte infrastructuur’ opgezet, een soort van referentie architectuur op (functionele) hoofdlijnen. Daar waar mogelijk wordt ook gerefereerd aan toe te passen standaarden bij de invulling van bepaalde aspecten. Naast een bouwstenen model besteed OPENDEI ook aandacht aan de besturing van de data space (een governancemodel). Met een actormodel wordt een suggestie gedaan voor een governance model gebaseerd op de Europese Governance Act. Ook wordt aandacht besteed aan het belang van een business model. Het position paper onderstreept daarmee mede het belang van data spaces en het soeverein delen van data in de toekomstige EU data-economie.

OPENDEI is een EU H2020 Coordination and Support Action (CSA) project, dat in de periode 2019-2022 is uitgevoerd. Het Projectconsortium, onder aanvoering van International Data Spaces Association is een samenwerking geweest met meer dan 40 data spaces initiatieven en experts uit het industriële domein, die meer dan 25 organisaties vertegenwoordigen uit 13 EU Horizon 2020 projecten en gerelateerde initiatieven. Dit heeft een eerste benadering opgeleverd van ontwerpprincipes voor data spaces en afspraken over de bouwstenen voor een ‘zachte’ infrastructuur en de governance van data spaces. In de volgende paragraaf gaan we kort in op de belangrijkste aspecten van de OpenDEI ‘design principles’.

OpenDEI principes en bouwstenen

OPENDEI principes

OPENDEI hanteert vier belangrijke principes:

Data sovereiniteit. Het vermogen van een natuurlijke persoon of organisatie tot exclusieve zelfbeschikking met betrekking tot haar economische data goederen. Dit is het innovatieve en transformatieve concept dat ten grondslag ligt aan data spaces;
Gelijk speelveld op data. Nieuwkomers ondervinden geen onoverkomelijke toetredingsdrempels vanwege monopolistische situaties. Wanneer er sprake is van een gelijk speelveld voor data delen , concurreren spelers op kwaliteit van de dienstverlening en niet op de hoeveelheid data die ze beheren. Een gelijk speelveld voor data is een cruciale voorwaarde om een eerlijke economie voor het delen van data te creëren;
Gedecentraliseerde ‘zachte infrastructuur’. De infrastructuur voor het delen van data is geen monolithische gecentraliseerde IT-infrastructuur. Het is een verzameling van interoperabele implementaties van data spaces, die voldoen aan een uniforme reeks van overeenkomsten in alle dimensies: functioneel, technisch, operationeel, juridisch en economisch. Uit het principe van datasoevereiniteit volgen functionele en niet-functionele vereisten van interoperabiliteit, overdraagbaarheid, vindbaarheid, beveiliging, privacy en betrouwbaarheid;
Publiek-private governance. Voor het ontwerp, de creatie en het onderhoud van het gelijke speelveld voor data is een goede governance essentieel. Alle belanghebbenden moeten zich vertegenwoordigd en betrokken voelen. Deze omvatten gebruikers (personen, organisaties) of leverancier van datadiensten, evenals hun technologiepartners en professionals.

OPENDEI bouwstenen

OPENDEI heeft een functioneel bouwstenen model voor data spaces ontwikkeld, dat veelvuldig wordt ingezet in verschillende initiatieven. In het onderstaande figuur 4.1 zijn de OPENDEI generieke bouwstenen opgenomen. Deze bouwstenen zijn ook in onderhavige studie als uitgangspunt genomen voor het bepalen van focusgebieden in verschillende data spaces initiatieven. De bouwstenen zijn uitvoerig toegelicht in paragraaf 2.4.

Figuur 4.1 - OPENDEI data space bouwstenen [[OPENDEI-DPR]]

Actormodel

De bouwstenen zullen uiteindelijk moeten worden geïmplementeerd en bestuurd worden door actoren. Daarvoor is ook een actormodel nodig (en een besturingsmodel). OPENDEI leunt wat betreft het actormodel voor het inrichten van de ‘zachte infrastructuur’ op het actormodel van IDS. OPENDEI heeft dit actormodel vereenvoudigd (zie figuur 4.2) .

Figuur 4.2 – OPENDEI actormodel [[OPENDEI-DPR]]

OPENDEI onderscheidt vier groepen belanghebbenden in data spaces: de eigenaar van de data (‘data owner’), de dataprovider, de dataverwerker (’data processing entity’) en de marktplaats operator. Figuur 4.2 illustreert de relaties en interacties tussen deze belanghebbenden en de datastroom die tussen hen plaatsvindt.

Een data eigenaar is een entiteit, die de bevoegdheid heeft om te beslissen hoe haar data door derden kunnen worden gebruikt. Afhankelijk van de dienst en oplossing en het bedrijfsmodel dat is opgezet, kan deze entiteit zelf data inwinnen (handmatig of met behulp van systemen) of tools en diensten van derden gebruiken om data te verkrijgen. Data kunnen on-premise, aan de rand (‘edge’) of in de cloud worden opgeslagen. Data eigenaren kunnen besluiten om hun data privé te houden voor intern gebruik (voor verbetering van eigen processen, creatie van nieuwe bedrijfswaarde voor commercieel voordeel, enz.) of deze openbaar maken of met een beperkt aantal derden delen. In het geval dat data in een of andere vorm beschikbaar worden gesteld aan derden (meestal gedaan met de hulp van een dataprovider), omvat dit rechten en plichten (beleid voor datagebruik) en algemene voorwaarden. Data eigenaren kunnen data gratis beschikbaar stellen aan derden (bijvoorbeeld om wetenschap en innovatie te bevorderen met open data) of tegen betaling aanbieden, afhankelijk van het businessmodel.

Een data provider of data leverancier is een entiteit, die verantwoordelijk is voor het verzamelen en voorbewerken van data en deze namens een data eigenaar aan anderen verstrekt (vaak als onderdeel van een bedrijfsgerelateerde dienst die aan een data eigenaar wordt geleverd). Hoewel de data worden verzameld, verwerkt en opgeslagen door de data provider ten behoeve van de klant (d.w.z. de data eigenaar), blijft het latere gebruik van de data meestal onder controle van de klant. Onlangs zijn er nieuwe bedrijfsmodellen ontstaan op basis waarvan data providers hun diensten tegen gereduceerde prijzen aanbieden in ruil voor de mogelijkheid om de geanonimiseerde data van hun klant te gebruiken om bestaande diensten verder te verbeteren of nieuwe diensten te creëren die nieuwe bedrijfswaarde genereren. De data provider biedt de data eigenaar technische middelen om betrouwbare data-uitwisseling en data-uitwisseling met andere deelnemers in de data space mogelijk te maken (inclusief monitoring van datagebruik, indien gevraagd).

Een data verwerker is een entiteit, die verantwoordelijk is voor en geïnteresseerd is in het gebruik van bepaalde soorten data om nieuwe diensten te creëren die op de markt worden aangeboden. Het spectrum van dergelijke diensten is zeer breed, variërend van domeinspecifieke use cases tot domeinoverschrijdende applicaties. De waarde van de data die worden gebruikt voor het maken van nieuwe diensten hangt af van de nauwkeurigheid van de data, de beschikbaarheid (d.w.z. het aantal data providers dat deze data aanbiedt) en hoe belangrijk deze zijn voor de gebruikte verwerkingsalgoritmen. Het wordt meestal vooraf geschat en overeengekomen, wat tot op zekere hoogte het vermogen van de dataeigenaar beperkt om maximale monetisatie van zijn data te bereiken, omdat ze geen goed begrip hebben van de extra waarde die boven op hun data wordt gecreëerd en / of de waarde die de nieuwe diensten hebben voor gebruikers. Aangezien de controle over het datagebruik is gebaseerd op conventionele contractdocumenten die door de betrokken partijen zijn opgesteld, wat leidt tot afhankelijkheid van handmatige/backoffice-activiteiten, wordt het gebruik van data verder gecompliceerd, waardoor de volledige exploitatie en monetarisering van data wordt vertraagd.

Een marktplaats exploitant is een entiteit, die verschillende soorten infrastructuur levert (bijvoorbeeld zachte infrastructuur, hardware, tools voor dataverwerking). Bovendien is exploitant verantwoordelijk voor het beheer van de markt door ondersteunende diensten te verlenen, algemene voorwaarden te definiëren en te beslissen over toelating en intrekking van data of deelnemers. Naarmate het belang en het potentieel van data steeds meer wordt erkend, ontstaan data marktplaatsen als een nieuw type bedrijfsaanbod. Hun doel is om datagebruik op een naadloze en geautomatiseerde manier mogelijk te maken, waarbij de noodzaak van gecompliceerde backofficecontracten en -overeenkomsten wordt omzeild. Een data marktplaats kan domeinoverschrijdend of domeinspecifiek zijn.Hun belangrijkste taak is om data gemakkelijk vindbaar te maken (op basis van een reeks gestandaardiseerde datamodellen) en om transparante tracking te bieden van alle datagerelateerde transacties (van wie welke data op welk moment heeft gebruikt tot inkomsten die worden gegenereerd uit het delen van data). Exploitanten van data marktplaatsen moeten mechanismen invoeren om de naleving van het beleid inzake datagebruik te waarborgen, bijvoorbeeld met betrekking tot de tijd en het aantal data waarop de data zijn gebruikt, of toepassingsgebieden waarin bepaalde data niet kunnen worden gebruikt.

Governancemodel

OPENDEI heeft een aanzet gegeven voor een globaal governance model, dat gebaseerd is de EU Data Governance Act. Met deze Act stelt de EU een Data Innovation Board (DIB) in, die adviseert over de werkwijzen in het kader van deze wet, de standaarden, en interoperabiliteit (zie verder Handreiking EU informatie). Voor Europese data spaces wordt aanbevolen om voor elke data space een (domein)autoriteit voor de governance aan te wijzen en een centrale autoriteit te hebben, die toezicht houdt op alle aspecten van de data space in verband met de interoperabiliteit van data space, d.w.z. de de facto 'zachte infrastructuur'. Deze centrale autoriteit zal communiceren met alle specifieke autoriteiten voor de afzonderlijke data spaces. Voor deze governancestructuur van de zachte infrastructuur moeten overheden op drie niveaus (strategisch, tactisch en operationeel niveau) in nauwe samenhang met elkaar opereren. De EU DGA specificeert de European Data Innovation Board (DIP) als de autoriteit op strategisch niveau. OPENDEI heeft in hoofdstuk 4 van het position paper voorgesteld om eveneens een autoriteit op tactisch en operationeel niveau aan te stellen, de 'Data Exchange Board' (DEB). In de onderstaande figuur 4.3 is deze governancestructuur weergegeven.

Figuur 4.3 OPENDEI Governance structuur voor de zachte infrastructuur [[OPENDEI-DPR]]

OPENDEI onderschrijft dit en doet de suggestie om naast de DIB een Data Exchange Board (DEB) in te richten. De DEB zal volgens OPENDEI twee hoofdactiviteiten kennen: 1. het verzorgen van het autorisatiekader en 2. het behandelen van alles met betrekking tot Europese data spaces die live en geadopteerd worden (d.w.z. implementatie, ondersteuning, communicatie). De DEB zelf zal een tweeledige structuur hebben. Een centrale rol zal worden gegeven aan de 'Raad van Deelnemers’. Deze raad zou kunnen bestaan uit vertegenwoordigers van gecertificeerde en aanblijvende partijen. De deelnemersraad krijgt het recht om de leden van de Raad van Commissarissen (samen met de DIB) te benoemen. De DEB krijgt eigen personeel. Een deel van dit personeel moet bestaan uit vertegenwoordigers van de bestuursorganisaties van de afzonderlijke data spaces. De organisatie verantwoordelijke voor de governance van elke data space zal een deel van de vertegenwoordigers aanwijzen om de DEB te bemensen. Bovendien kunnen de deelnemers van elke data space vertegenwoordigers sturen naar de Raad van Toezicht, de Raad van Deelnemers en de Change Advisory Board. De organisatiestructuur van de governance-entiteiten van de afzonderlijke data spaces moet vergelijkbaar zijn met deze algemene governancestructuur. OPENDEI adviseert daarmee ook om een strategisch, een tactisch en een operationeel niveau te definiëren voor het bestuur van de afzonderlijke data spaces, waarbij elk niveau wordt gecontroleerd door organisatorische organen die bestaan uit vertegenwoordigers van deelnemende organisaties.

Data space domeinen

OPENDEI heeft tevens voor vier data space domeinen verkent welke specifieke aspecten in deze data spelen van belang zijn. Het gaat om de domein industrie, energie, gezondheid en agri-voedsel.

Naast bovengenoemde onderwerpen, is OPENDEI is actief geweest op verschillende fronten:

Platformontwikkeling. OPENDEI heeft een vergelijking van referentiearchitecturen [[OPENDEI-ARCH]] voor data spaces uitgevoerd, waardoor een uniform industrieel dataplatform mogelijk wordt;
Bouwen van data-ecosystemen. Een innovatie- en samenwerkingsplatform mogelijk maken, een Europees netwerk van DIH's smeden, bijdragen aan de catalogus van industriële vaardigheden en waarnemingspost;
Grootschalige data space pilots voor industrie, energie, gezondheid en agri-voedsel. Bijdragen aan een digitaal volwassenheidsmodel, het creëren van een reeks beoordelingsmethoden en een benchmarkingtool voor migratietrajecten.

Synthese

OPENDEI heeft als EU project zich gericht zich op de ondersteuning van data spaces in vier domeinen: industrie (productie), energie, gezondheid, landbouw (agri-food). OpenDEI heeft voor deze domeinen aanwezige referentie-architecturen in beeld gebracht [[OPENDEI-ARCH]]. In het position paper ‘Design principles for data spaces’ [[OPENDEI-DPR]] heeft OPENDEI inzicht gegeven in functionele bouwstenen voor data spaces. De bouwstenen zijn globaal en functioneel beschreven naar governance, interoperabiliteit, vertrouwen en data waarde. Een gedetailleerde uitwerking van deze bouwstenen is niet gegeven. Enkel de uitwerking van het maken van business model en value cases voor de domeinen alsook het aanzet voor het maken van een governance model en actorenmodel worden als focusgebied benoemd.

Vandaar dat deze elementen als focusgebieden in de onderstaande figuur 4.4) zijn uitgelicht.

Figuur 4.4 – Focusgebieden van OPENDEI

Data sharing coalition

Inleiding

De verschillende initiatieven voor het delen van data zijn vaak gericht op een specifieke sector of toepasssingsdomein. De Data Sharing Coalition wil voortbouwen op bestaande initiatieven voor het delen van data om ze te versterken in en over hun domein heen. De Data Sharing Coalition heeft zich tot doel gesteld het cross-domein data delen onder controle van de rechthebbende partij te stimuleren, door interoperabiliteit tussen domeinen mogelijk te maken. De Data Sharing Coalition is een internationaal initiatief waarin een grote verscheidenheid aan organisaties samenwerkt om het data delen tussen bestaande data spaces mogelijk te maken. Door interoperabiliteit mogelijk te maken tussen bestaande en toekomstige data spaces met datasoevereiniteit als kernprincipe, kunnen partijen uit verschillende sectoren en domeinen eenvoudig data met elkaar delen, waardoor aanzienlijke economische en maatschappelijke waarde wordt ontsloten. De Data Sharing Coalition realiseert daarvoor verschillende cross-domein use cases. In deze use cases definiëren en realiseren organisaties uit verschillende domeinen samen een use case die nieuwe waarde realiseert dankzij (cross-sectoraal) data delen.

De coalitie is in januari 2020 gestart met steun van het Ministerie van Economische Zaken en Klimaat in Nederland. De verwachte levensduur van de projectfase van de coalitie is tot 2025. Tegen 2025 zal de Data Sharing Coalition naar verwachting haar resultaten en activiteiten hebben overgedragen aan een entiteit, die een Trust Framework exploiteert en beheert dat cross-domein data delen faciliteert. De eerste fase van de Data Sharing Coalition is een onderzoek naar het harmonisatiepotentieel om domeinoverstijgend data delen mogelijk te maken. Dat is uiteengezet in de Data Sharing Canvas, waarin de onderdelen van het cross-domein data delen zijn benoemd.

Data sharing canvas

De Data Sharing Coalition heeft momenteel twee duidelijke focusgebieden: de ontwikkeling van het Data Sharing Canvas als een soort van referentie architectuur voor het delen van data en de onderbouwing daarvan met de inzichten en ervaringen uit use cases.

Het Data Sharing Canvas is het conceptueel model voor het realiseren van een “trust framework for cross-domain data sharing” [[DSC-DSC]]. Het Data Sharing Canvas geeft een overzicht van de onderwerpen nodig voor data delen en hun implicaties. Het Canvas heeft niet tot doel uitputtend te zijn of in detail invulling te geven aan deze onderwerpen. Het Canvas vormt ook de globale leidraad voor toekomstige werkzaamheden van de Data Sharing Coalition, maar biedt vooralsnog geen houvast voor bindende overeenkomsten of (technische) vereisten voor data delen. Daarvoor voorziet DSC een taak voor het nog te realiseren vertrouwenskader . Aan de hand van een BLOFT model wordt het DSC vertrouwenskader beschreven. Het BLOFT model is in figuur 5.1 weergegeven.

Het Data Sharing Canvas [[DSC-DSC]] is het huidige conceptuele kader, dat input geeft aan de Blueprint [[DSC-UCBP]] en een vertrouwenskader. In de Data Sharing Canvas zijn daarvoor de principes voor data delen uiteengezet, evenals de belangrijke concepten en onderwerpen. De onderwerpen zijn globaal en conceptueel beschreven naar leidende principes, concepten (en actoren), harmonisatie via het ‘proxy model’ en de specifieke aandacht voor de volgende onderwerpen: termen en condities, Identificatie-Autorisatie-Authenticatie (IAA), wettelijke aspecten, informatiebeveiliging, data uitwisseling, operationele overeenkomsten, business modellen en besturing (‘governance’), data standaarden en metadata. Deze onderwerpen worden vnl. conceptueel toegelicht.

Figuur 5.1 – BLOFT model Data Sharing Coalition [[DSC-DSC]]

Een belangrijke rol is wegggelegd voor het Proxy model; een concept vergelijkbaar met de IDS data connector, die het mogelijk moet maken om het data delen tussen een vrager en aanbieder van het ene domein met het andere domein te verbinden. Om interoperabiliteit tussen domeinen en toekomstige schaalbaarheid mogelijk te maken, heeft elk domein volgens DSC nl. een proxy nodig. Proxy’s zijn systemen, die door elk domein moeten worden gebruikt met de functie van vertaling tussen domeinspecifieke specificaties en gemeenschappelijke, geharmoniseerde inter-domeinspecificaties. Dit is nodig om interoperabiliteit en vertrouwen tussen domeinen te bereiken. In figuur 5.2 is het proxy concept van DSC weergegeven. Dit model geeft weer welke actoren in scope zijn van DSC: de data service provider, de data service consumer, de rechthebbende en Domein Proxies.

Figuur 5.2 Proxy als intermediar tusssen data service consumer en provider [[DSC-UCIG]]

De data service provider wordt gedefinieerd als de actor, die een data service aanbiedt aan de consument . In het use case archetype, beschreven in de Use Case Implementation Guide [[DSC-UCIG]], mag de data service provider de data service alleen leveren wanneer de rechthebbende partij expliciet toestemming heeft gegeven. De data service provider definieert de data service en de bijbehorende algemene voorwaarden.

Een data service consument wordt gedefinieerd als de actor die gebruik maakt van een data service, die wordt aangeboden door de data service provider. De consument dient kennis te nemen van de data service aangeboden door de provider en zijn algemene voorwaarden te accepteren voordat de consument de data service kan initiëren. De rechthebbende wordt gedefinieerd als de entiteit, die rechten heeft op data. De rechthebbende keurt de data service goed, waardoor de data waarop zij rechten hebben, kunnen worden gedeeld door de provider aan de consumer.

De Data Sharing Coalition biedt naast de Data Sharing Canvas een evidente methode om een data space opzetten via het maken van een use case voor data delen. Daarvoor heeft de DSC drie ondersteunende methoden ontwikkeld. Het begint met Use Case Playbook [[DSC-UCPB]], de ‘kickstarter’ voor een data space initiatief. Dit draaiboek versnelt nieuwe use cases voor het delen van data doordat het stapsgewijze aanpak biedt voor het genereren, beoordelen en realiseren van de data space (vanuit het idee of eerste initiatief). Het begeleidt de gebruiker door de verschillende stappen, zoals het vaststellen van de context en scope, de waardebepaling, complexiteit van interacties en uiteindelijke vaststelling om tot realisatie over te gaan. De focus van dit draaiboek is om een uitgebreid en gestructureerd proces te bieden om de use case voor het data delen te ontwikkelen. Het draaiboek introduceert vijf stappen van use case ontwikkeling en geeft een concrete doelstelling, aanpak en middelen voor elke stap. Voor verschillende stappen, die in chronologische volgorde worden doorlopen, worden ter ondersteuning sjablonen verstrekt.

Als tweede stap van de use case ontwikkeling, biedt de blueprint [[DSC-UCBP]] een uitwerking van het Data Sharing Canvas in een praktische, bruikbare aanpak voor het opstarten van de ontwikkeling van een data space [[DSC-UCBP]]. De blueprint behandelt alle relevante onderwerpen en inzichten uit het Data Sharing Canvas en biedt een goede startpositie voor het realiseren van een data space. Daarvoor wordt in drie fasen inzichtelijk gemaakt welke ontwerpkeuzes gemaakt worden voor de relevante onderwerpen:

Reikwijdte en ambitie. Waarom wilt u het delen van data mogelijk maken en hoe profiteert u hiervan? Relevante onderwerpen om te bespreken zijn: context en doel, leidende principes en functionele scoping;
Ontwikkel de overeenkomsten die nodig zijn om de benodigde functionaliteiten mogelijk te maken. Relevante onderwerpen om te bespreken zijn: Zakelijke onderwerpen (bijv. tariefstructuren), juridische onderwerpen (bijv. governance), operationele onderwerpen (bijv. risicobeheer), functionele onderwerpen (bijv. gebruikerservaring) en technische onderwerpen (bijv. technische specificaties);
Bepaal de vereiste functionaliteiten om uw use case mogelijk te maken. De relevante onderwerpen om te bespreken zijn: rollen en verantwoordelijkheden, functionele componenten en het interactiemodel.

Tenslotte, geeft de Use Case Implementation Guide [[DSC-UCIG]] de laatste zet.

Het zal domeinen informeren, inspireren en versnellen in het delen van data en hen ondersteunen bij het opzetten van activiteiten voor het delen van data.

De Implementation Guide is gebaseerd op open standaarden en afgestemd op bestaande standaarden en implementaties voor het delen van data. Daartoe geeft de Implementation Guide een overzicht en uitleg over hoe principes van het International Data Spaces (zie hoofdstuk 3) en het vertrouwenskader iSHARE (zie hoofdstuk 7) kunnen worden toegepast voor de implementatie van een data space. Daarvoor zijn in de UCIG concepten van actoren en rollen geleend van IDS en voor het vertrouwd uitwisselen van data zijn bijvoorbeeld elementen geleend van iSHARE, zoals machine-to-machine authenticatie . Om zich voor te bereiden op toekomstige interoperabiliteit zijn de eisen in de UCIG zoveel mogelijk gebaseerd op de iSHARE-implementatie en -infrastructuur, waarbij wordt afgestemd op de specifieke context van de UCIG. iSHARE wordt geintroduceerd toegelicht in hoofdstuk 7.

Synthese

Het Data Sharing Coalition initiatief is Nederlands initiatief met een internationale focus. DSC richt zich op cross-domein data delen. DSC heeft voor cross-domein data delen een referentie architectuur ontwikkeld, genaamd het Data Sharing Canvas. Het Data Sharing Canvas is een belangrijk focusgebied van DSC en geeft globaal inzicht in de belangrijke onderwerpen voor data delen. Dit zijn de onderwerpen die nader uitgewerkt gaan worden in het aangekondigde DSC vertrouwenskader. Een gedetailleerde uitwerking van deze bouwstenen om implementatie van de bouwstenen mogelijk te maken is nog niet voorhanden. DSC heeft daarentegen veel aandacht besteed aan de implementatie van use cases en value cases. De Blueprint helpt organisaties om de Data Sharing Canvas toe te passen voor opzetten van een use case voor data delen. De uitwerking van DSC richting implementatie komt terug in de Use Case Implementation Guide. De Implementatie Guide maakt gebruik van het actormodel van IDS en de implementatieconcepten van iSHARE als vertrouwenskader. De ontwikkeling van use cases en de value case kan gerust als focusgebied van DSC worden benoemd. Vandaar dat deze elementen als focusgebieden in de onderstaande figuur 5.3) zijn uitgelicht.

Figuur 5.3 – Focusgebieden van Data Sharing Coalition

Tenslotte heeft de Data Sharing Coalition een position paper ontwikkeld [[DSC-PP]], waarin de samenwerking en relatie van DSC met de andere data space initiatieven is geschetst. Dit position paper is mede leidraad geweest voor de analyse uitgevoerd in onderhavige verkenning.

iSHARE

Inleiding

iSHARE is een Nederlands initiatief dat werkt aan een vertrouwenskader voor data spaces toegepast iSHARE is ontstaan in de logistieke sector vanuit de vraag waarom organisaties weinig tot geen data met elkaar delen. Vanuit de eerste fase in 2016 is iSHARE opgebouwd met hulp van co-creatie partners. Deze partners hebben verschillende achtergronden: de private en publieke sector, organisaties van verschillende grootte, verschillende modaliteiten, zowel aanbieders als gebruikers van data. Deze verscheidenheid aan organisaties zorgt ervoor, dat het iSHARE vertrouwenskader breed toepasbaar is geworden.

Door gebruik te maken van het vertrouwenskader van iSHARE hebben data providers de zekerheid, dat organisaties die toegang hebben tot data diensten wettelijk onder de geheimhoudingsovereenkomst vallen en in de licentie blijven die met de data is afgegeven. En daarnaast heeft de data provider de zekerheid dat alleen data, die de data provider heeft geautoriseerd, wordt gedeeld met de afnemende partij die de data provider ook heeft geautoriseerd. iSHARE is een volledig gefedereerde structuur en juridisch kader, die vertrouwen, databescherming en datasoevereiniteit binnen data spaces mogelijk maakt. iSHARE is een concrete invulling voor vertrouwelijk data delen in een data space met gebruik van open standaarden. iSHARE biedt ook referentie implementaties voor de bijbehorende data voorzieningen.

iSHARE ‘trust framework’

Het iSHARE ‘trust framework’ of vertrouwenskader is een uniforme set van afspraken voor Identificatie, Authenticatie en Autorisatie (IAA), inclusief tooling die benodigd is om dit afsprakenstelsel te implementeren. Het iSHARE kader beschrijft een actormodel met zes rollen die, afhankelijk van de situatie, met elkaar interacteren op basis van de iSHARE ‘schemaovereenkomsten’ (zie figuur 6.1) [[iSHARE-GOV]].

Figuur 6.1 – iSHARE actormodel [[iSHARE-GOV]]

Elke rol heeft een bepaalde functie in het schema en draagt bepaalde verantwoordelijkheden. Elke partij, die een rol vervult in iSHARE moet iSHARE-houder of iSHARE-gecertificeerd zijn:

Partijen, die een ‘aanhangende rol’ vervullen, leveren en consumeren diensten onder iSHARE. Deze partijen houden zich aan de iSHARE gebruiksvoorwaarden;
Partijen, die een ‘gecertificeerde rol’ vervullen leveren de faciliterende functies, waarop de ‘aanhangende partijen’ kunnen vertrouwen bij het verlenen of consumeren van diensten. Om gecertificeerd te worden, moeten deze partijen niet alleen aantonen dat ze zich aan de iSHARE-gebruiksvoorwaarden houden, maar ook voldoen aan een aantal rol-specifieke criteria.

De ‘service consumer’ of consument wordt vervuld door een rechtspersoon, die een data dienst gebruikt, zoals verstrekt door een ‘service provider’ of dienstverlener. Een consument kan worden vertegenwoordigd door een machine (zijn systeem) of een persoon, respectievelijk de ‘machine service consumer’ en de ‘human service consumer’ genoemd. De dienstverlener is een rechtspersoon, die een data dienst levert voor consumptie door een consument.

De rol van ‘entitled party’ of rechthebbende wordt vervuld door een rechtspersoon, die één of meer rechten heeft op een door een dienstverlener geleverde dienst, bijvoorbeeld op data. De data eigenaar is een voorbeeld van een rechthebbende. Deze rechten, of aanspraken, zijn vastgelegd in een rechtsverhouding tussen de rechthebbende en de dienstverlener.

De ‘identity provider’ of identiteitsprovider is een rechtspersoon wiens tooling personen identificeert en authentiseert (en in het bijzonder personen, die consumenten vertegenwoordigen). Een identiteitsprovider biedt identificatie-informatie voor personen en geeft inloggegevens (d.w.z. een wachtwoord of elektronische keycard) aan personen. De identiteitsprovider bewaart de informatie over autorisaties van personen, die een consument vertegenwoordigen, d.w.z. informatie die aangeeft welke personen bevoegd zijn om namens een consument te handelen. Op basis van deze informatie kan de identiteitsprovider nagaan of een persoon die een rechtspersoon vertegenwoordigt, bevoegd is om een dienst af te nemen en kan de identiteitsprovider aan de dienstverlener bevestigen of dit het geval is. Als gevolg hiervan kunnen dienstverleners de identificatie en authenticatie van personen, evenals taken met betrekking tot het beheer van autorisatie- en delegatie-informatie van personen, uitbesteden aan een identiteitsprovider (in plaats van hun eigen tooling te implementeren).

Als dienstverleners ervoor kiezen om identificatie en verificatie uit te besteden aan meer dan één identiteitsprovider, kunnen ze verbinding maken met een ‘identity broker’ of identiteitsmakelaar in plaats van met meerdere identiteitsproviders. Verschillende personen kunnen identificaties aanbieden via verschillende identiteitsproviders. Ook moeten dienstverleners mogelijk verbinding maken met verschillende identiteitsproviders. Om ervoor te zorgen dat dienstverleners geen relatie met elke identiteitsprovider afzonderlijk nodig hebben, is een identiteitsmakelaar geïntroduceerd. De identiteitsmakelaar is een rechtspersoon, die dienstverleners toegang biedt tot verschillende identiteitsprovider en die mensen de mogelijkheid biedt om te kiezen met welke identiteitsprovider zij zich in het gehele iSHARE afsprakenstelsel identificeren en authentiseren.

De rol van autorisatieregister wordt vervuld door een rechtspersoon, die oplossingen biedt voor de aanhangende partijen voor de opslag van delegatie- en autorisatie-informatie. Een autorisatieregister beschikt over informatie over delegaties naar dienstverlenende consumenten; d.w.z. informatie die aangeeft welke delen van de rechten van een rechthebbende partij zijn gedelegeerd aan een consument. Op basis van deze informatie kan het autorisatieregister het nagaan of een machine die een rechtspersoon vertegenwoordigt, bevoegd is om een dienst af te nemen en bevestigt het autorisatieregister dit aan de dienstverlener.

Voorbeeld iSHARE vertrouwd data delen use case

Om te illustreren hoe iSHARE vertrouwd data delen mogelijk maakt met behulp van het bovenstaande actormodel is hieronder een use case voorbeeld opgenomen. Om dit mechanisme van vertrouwd data delen toSHAREGOVF]e te lichten, hanteren we het volgende iSHARE use case voorbeeld [[iSHARE-S]]: het Centraal Bureau voor de Statistiek (CBS) wil (statistische) data voor haar modaliteitsrapportage opvragen van een vertrouwde importeur van televisies (die ook deelnemers is bij de iSHARE satelliet (zie figuur 6.2).

Figuur 6.2 – iSHARE use case modaliteitsrapportage CBS (bron: iSHARE youtube presentatie)

De volgende stappen worden doorlopen om de data delen:

Het CBS heeft data nodig van data eigenaar T (importeur van Televisies) voor haar modaliteitsrapportage en weet even niet of de data eigenaar T is aangesloten bij iSHARE en of de data beschikbaar is in het iSHARE netwerk;
CBS toetst in het iSHARE netwerk of de data eigenaar T is aangesloten voor de betreffende dienst (de data voor modaliteitsrapportage) en waar de data van de data provider T verkrijgbaar is. Daarvoor raadpleegt CBS de iSHARE Satelliet;
De iSHARE Satelliet laat aan CBS weten bij welke data provider de data van data eigenaar T te halen is. Dit is data provider ‘Modality’;
Het CBS vraag aan de data provider ‘Modality’ of het CBS mag beschikken over de data van data eigenaar T. Het CBS vraagt aan de betreffende data provider Modality om de data.
De data provider ‘Modality’ controleert eerst of het CBS een betrouwbare data consument is en Modality doorloopt daarvoor de volgende ‘toetsen’: a. Modality controleer bij de Satelliet of data consument CBS in de iSHARE netwerk zit en b. Modality controleer bij de Satelliet of data eigenaar T in de iSHARE netwerk zit;
Modality toetst vervolgens in het autorisatieregister van Poort8, waar de autorisaties van de data eigenaar staan, of de gevraagde data dienst van eigenaar T wel gedeeld mag worden met het data consument CBS (en welke attributen; bepaalde velden gedeeld mogen worden).
Indien ja, dan levert Modality als data provider de data dienst aan data consument CBS;
Indien het autorisatieregister geen toestemming geeft, vraagt de data provider Modality aan de data eigenaar T of het de data dienst wil leveren aan het CBS. Als de eigenaar dat wil, dan laat eigenaar T dat weten aan het autorisatieregister en wordt het register bijgewerkt onder de voorwaarden van T, zodat de data consument CBS toegang tot de data krijgt.
Modality levert als data provider de data aan data consument CBS.

iSHARE Satellieten

De iSHARE Satelliet vormt de kern van het iSHARE-vertrouwensnetwerk, als coördinator en governancekern in een data space. Daarom wordt de iSHARE Satelliet beheerd door coördinerende organisaties binnen een data space, die deelnemers bedient en toegang geeft. De iSHARE Satelliet heeft de rol van ‘schemabeheerder’ en zorgt voor:

Toelating; vertrouwde registratie van deelnemers die gevalideerd zijn;
Terugtrekking: permanente beëindiging van deelnemers die de grenzen hebben overschreden of waarschuwingen negeerden;
Waarschuwingen, opschorting en uitsluiting;
Wijzigingen en updates: het registreren van aanvullende gegevens aan deelnemers, zoals extra data spaces, extra gegevensvelden of nieuwe autorisatieregisters.

Binnen een iSHARE Satelliet (ook wel iSHARE Node genoemd) kunnen beheerders deelnemers registreren met:

Hun unieke ID (EORI-nummers in overeenstemming met EU-identificatie) en
EIDAS-identificatie;
Een publieke sleutel (alleen voor dienstverleners en consumenten en gecertificeerde partijen);
Ondertekende gebruiksvoorwaarden en eventuele aanvullende voorwaarden en van KvK-documentatie om er zeker van te zijn dat het contract wettelijk is ondertekend.
Voor het beheer van deelnemers heeft iSHARE een webinterface op de Node of API’s beschikbaar voor geautomatiseerde registratie.

Standaarden en protocollen

Aangezien iSHARE een cross-domein data space vertrouwensraamwerk is, wordt de registratie gedaan volgens de algemene voorwaarden van iSHARE in alle data spaces met iSHARE als vertrouwenskader. Organisaties, die deel uitmaken van het iSHARE netwerk, de data eigenaren, data providers en data consumenten, hebben allemaal dezelfde Non-Disclosure Agreement en gebruiksvoorwaarden ondertekend. Elke partij wordt in het registratieproces gevalideerd door de iSHARE Satelliet om een betrouwbare onboarding te garanderen. Via het federatieve autorisatieregister geven data eigenaren toestemming voor delen van gegevenskenmerken, die beschikbaar zijn bij data providers, specifiek aan geselecteerde consumenten met behulp van licenties. In dit samenwerkingsschema, op basis van technische specificaties van iSHARE, kunnen partijen data delen , onafhankelijk waar de data ook wordt opgeslagen (bij SaaS-aanbieders in het iSHARE-netwerk of bij eigen diensten)

De technische specificaties en API-architectuur van iSHARE zijn gebaseerd op de volgende onderdelen, standaarden en protocollen:

PKI en digitale certificaten; Voor de authenticatie van partijen en machines maakt iSHARE gebruik van PKI en digitale certificaten;
HTTP via TLS (HTTPS); iSHARE gebruikt het veelgebruikte HTTP-protocol voor zijn communicatie, inclusief TLS om de communicatie te versleutelen;
RESTful API’s; iSHARE gebruikt de RESTful-architectuurstijl om API's en HTTP-aanroepen te structureren;
JSON/JWT; Gegevens die in de iSHARE-context worden uitgewisseld, worden gestructureerd met behulp van de JSON-standaard. Waar onweerlegbaarheid vereist is, worden JSON Web Tokens (JWT) gebruikt;
XACML. Delegaties zijn gestructureerd volgens een JSON-poort van de XACML-standaard.

De combinatie van bovenstaande standaarden en protocollen leidt tot een zekere dynamiek tussen de rollen in het iSHARE raamwerk. In wezen verwerven consumenten een token waarmee ze toegang hebben tot bepaalde services van bepaalde dienstverleners. De rollen, die in het iSHARE raamwerkzijn gespecificeerd, zijn gebaseerd op de OAuth-standaard. Het OAuth2.0-protocol is een implementatietechnologie voor beleidsbeheer (‘policies’) met toegangstokens, gebaseerd op generieke web service aanroepen in de vorm van API's. API’s van service providers gebruiken die toegangstokens voor verificatie van consumenten. Er wordt daarbij een twee fasen benadering gevolgd, waarbij eerst een toegangstoken wordt verkregen van de dienstverlener, op basis van goedkeuring door de rechthebbende partij, waarmee vervolgens de data door de consument kan worden opgehaald bij de dienstverlener. Beleidshandhavingsmogelijkheden zijn alleen vereist voor de dienstverlener.

Het concept van iSHARE-satellieten in combinatie met de iSHARE autorisatieregisterrol in data spaces is eveneens gebaseerd op International Data Spaces [[IDS-RAM4]] en vervolledigt de waarde propositie van volledig vertrouwen en zekerheid op juridische en technische basis van de deelnemers in data spaces.

iSHARE governance

De besturing van het iSHARE raamwerk is geregeld via een Nederlandse stichting, opgericht In 2018. Deelnemende partijen aan iSHARE kunnen door een overeenkomst aan te gaan met deze stichting toetreden tot het iSHARE netwerk en het afsprakenstelsel. Een partij die toetreedt, werkt volgens de afspraken van het stelsel. Daartoe adopteert deze partij iSHARE specificaties in haar API software en toont daarbij aan te voldoen aan de afspraken van het stelsel. Om formeel toe te treden tekent een deelnemende partij een zogenaamde ‘toetredingsovereenkomst’ met de stichting iSHARE.

De besturing van het iSHARE scheme [[iSHARE-S]] ligt bij de iSHARE stichting en is vastgelegd in het governancemodel van iSHARE (zie figuur 6.3) [[iSHARE-GOV]]. De iSHARE satellieten benoemen de leden in de iSHARE governance entiteiten en de data spaces die iSHARE als vertrouwensraamwerk gebruiken krijgen een plaats in de iSHARE governance en hebben zo invloed op de verdere ontwikkeling en behartiging van het belang van de data spaces.

Figuur 6.3 – Besturing van het iSHARE scheme [[iSHARE-GOV]]

Synthese

Het OPENDEI bouwstenen model voor data spaces laat zien, dat data soevereiniteit en vertrouwen en de drie bijbehorende bouwstenen identiteitsmanagement, toegangs- en gebruikscontrole en vertrouwde uitwisseling een belangrijk en integraal onderdeel zijn van het data space concept. Gezamenlijk worden ze het ‘vertrouwenskader’ genoemd. iSHARE positioneert zich in deze categorie van data space bouwstenen(zie figuur 6.4).

Figuur 6.4 – Focusgebieden iSHARE in relatie tot het OPENDEI model (bron: iSHARE)

iSHARE is ontstaan in de logistiek, maar tevens toepasbaar in andere toepassingsdomeinen (figuur 6.5).

Figuur 6.5 – Focusgebieden van iSHARE

Als referentie architectuur voor het iSHARE vertrouwensraamwerk fungeert het iSHARE Scheme [[iSHARE-S]]. In het iSHARE Scheme is o.a. het actormodel en het governancemodel voor vertrouwd data delen en opgenomen. Het belangrijkste focusgebied van iSHARE is daarmee het volledige uitgewerkte vertrouwenskader met voorbeeldimplementaties van de componenten op github. Het autorisatieregister is als catalogus (meta discovery) eveneens als focusgebied getypeerd.

Afstemming vertrouwensraamwerken

Ook geeft iSHARE invulling aan de ontwikkeling van data spaces in lijn met de International Data Spaces [[IDS-RAM4]] en Gaia-X [[Gaia-X-ARCH]]. Het iSHARE vertrouwenskader biedt basiscomponenten voor data spaces en leveren deze, in overeenstemming met de ontwerp-principes van OPENDEI, maar ook in overeenstemming met de grotere oplossingsarchitecturen zoals International Data Spaces en Gaia-X. Hierbij werkt iSHARE nauw samen met de internationale gemeenschap aan datastandaarden en andere bouwstenen voor data spaces om deze data spaces in heel Europa te stimuleren. Een nadere duiding van het iSHARE initiatief als vertrouwenskader voor data spaces ten opzichte van enkele eerder besproken Europese data space initiatieven IDSA (hoofdstuk 2), GAIA-X (hoofdstuk 3) en OPENDEI (hoofdstuk 4) is uiteengezet in [[TNO]].

Ook het recent gelanceerde i4Trust EU project zal bijdragen aan verdere afstemming tussen het vertrouwenskader van iSHARE en enkele Europese data space initiatieven. I4Trust stimuleert met subsidies de totstandkoming van data spaces in verschillende domeinen en heeft als doel daarmee de data-economie met data spaces in Europa te versnellen. Daarbij wordt gebruik gemaakt van het iSHARE Trust framework.

In de recente samenwerking tussen iSHARE en Gaia-X, zijn partijen overeengekomen om beide vertrouwensraamwerken te harmoniseren om ontwikkeling van data spaces te versnellen. Het doel hiervan is geharmoniseerde interfaces en vertrouwensniveaus, wat in lijn is met de samenwerkingsovereenkomst tussen iSHARE en International Data Spaces. Deze heeft als doel om op één lijn te zitten met het gezamenlijke technologie framework dat ontwikkeld wordt door de Data Spaces Business Alliance (BDVA, Gaia-X, IDSA, FIWARE). Het Identity and Access Management framework van i4Trust zal evolueren om af te stemmen met de resultaten van de recente Technology Convergence discussie onder de koepel van de Data Spaces Business Alliance [[DSBA]].

De Europese geo-informatie infrastructuur

Dit hoofdstuk beschrijft en introduceert de het gebruik van het concept ‘data space’ vanuit het perspectief van de Europese Geo-Informatie Infrastructuur (NGII). We belichten het ‘data fundament’, de afspraken over standaarden voor interoperabiliteit, de bouwstenen en voorzieningen in de Europese geo-informatie infrastructuur, die in de afgelopen 15 jaar is gerealiseerd op basis van de Europese INSPIRE Richtlijn.

De Europese geo-informatie infrastructuur

Een inmiddels geïmplementeerde data space in de Europese Unie is de Europese geo-informatie infrastructuur die tot stand is gekomen na de invoering van de Europese INSPIRE Richtijn in 2007, in Nederland bekend als de INSPIRE Wet. In het kader van INSPIRE zijn vanuit Nederland op gestandaardiseerde en geharmoniseerde wijze zo’n 200 nationale datasets beschikbaar gesteld aan de Europese geo-informatie infrastructuur. Deze datasets zijn vindbaar, bekijkbaar (metadata en view service) en downloadbaar (directe download en indirecte bulkdownload). De data zijn in Nederland vindbaar in het nationaal georegister, dat tevens fungeert als nationaal toegangspunt voor het EU geoportaal. Het Europese geoportaal is de centrale catalogus waar alle lidstaten hun data producten (datasets en netwerkdiensten) voor de Europese geo-informatie infrastructuur kenbaar maken.

De Europese richtlijn INSPIRE verbetert de beschikbaarheid, kwaliteit, toegang tot en uitwisseling van plaatsgebonden data of locatiedata over het milieu in Europa. Denk aan data als de locatie van administratieve grenzen, watersystemen, landbouw, industrie en vervoersnetwerken en de geografische spreiding van luchtkwaliteit en geluid, maar ook van bevolking, plant- en diersoorten en de gezondheid op een locatie. INSPIRE verplicht de publieke dataproviders in de 27 Europese lidstaten om locatiedata over 34 thema’s digitaal vindbaar, bruikbaar en uitwisselbaar te maken. De beschrijvingen van deze 34 thema’s zijn hier te vinden. Om dit mogelijk te maken worden de datasets gestandaardiseerd beschikbaar gemaakt, zodat de datasets binnen en tussen lidstaten naadloos aansluiten en eenzelfde, begrijpelijke taal spreken. Daarmee is een netwerk van data diensten op het Internet ontstaan, waarmee publieke en openbare locatiedata veel beter, uniformer en begrijpelijker toegankelijk worden voor overheid, burgers en bedrijven en de Europese data-economie.

De INSPIRE principes

INSPIRE kent een aantal uitgangspunten en principes:

INSPIRE is bedoeld om op kwalitatief hoogwaardige wijze milieudata vrij beschikbaar te stellen via het Internet, zowel voor de overheid als voor burgers en bedrijven;
INSPIRE is een geografische informatie infrastructuur voor het delen van milieudata op basis van een omvangrijke set van standaardisatie afspraken voor geo-informatie uitwisseling;
De infrastructuur gedachte gaat uit van het eenmalig verzamelen en opslaan (bij de bron) en het via de locatie kunnen combineren van verschillende milieudatasets uit meerdere bronnen naar de vele gebruikers en hun toepassingen;
INSPIRE gaat niet over het inwinnen van milieudata. INSPIRE vraagt publieke organisaties om aanwezige data beschikbaar te stellen in een uniforme structuur. Het is ook niet noodzakelijk voor INSPIRE gegevens te verzamelen;
De milieudata is eenvoudig vindbaar en het is duidelijk hoe de data kan worden gebruikt ten behoeve van een bepaald gebruiksdoel en onder welke condities en gebruiksvoorwaarden de data worden beschikbaar gesteld;
De methode INSPIRE werkt met en op internationale open standaarden aangaande de 3 bouwstenen: 1. diensten in de vorm van web services, 2. informatiemodellen voor uniforme data en 3. metadata voor zowel de services als datasets;
INSPIRE is functioneel simpel en 3-ledig. De gebruiker kan milieudata 1. zoeken, 2. bekijken en 3. downloaden en aanroepen;
INSPIRE biedt afspraken over het beperken van de toegang tot milieudata. Voor EU instellingen zijn nog specifieke regels opgesteld.

De INSPIRE functies

Voor gebruikers heeft INSPIRE een vrij overzichtelijke opzet (zie figuur 7.1) en is INSPIRE functioneel simpel gehouden met 3 functies: zoeken - bekijken – downloaden en aanroepen. Dit staat ook wel bekend als het publish-find-bind principe van service oriented architectuur. De gebruiker kan de milieudata zoeken via de zoekdienst (discovery service), zoals het nationaal georegister, het EU portaal of een eigen applicatie. De gebruiker evalueert de geschiktheid van de milieudata op basis van de eigenschappen van de dataset (metadata) en/of door het bekijken van de dataset in kaartvorm (view service). Indien de gebruiker de data geschikt acht voor haar gebruiksdoel, wordt de data gedownload voor gebruik (download service), of aangeroepen als ruimtelijke datadienst (spatial data service). De ruimtelijke datadienst maakt een meer specifieke bevraging op de dataset mogelijk (bijv. geocodering van een adres, een berekening tussen twee punten, etc.). De gebruiker krijgt toegang tot de data via zijn eigen bedrijfsapplicatie(s). De bedrijfsapplicaties moeten daarvoor wel geschikt zijn, d.w.z. de INSPIRE standaarden ondersteunen.

Figuur 7.1 – Referentie architectuur INSPIRE [[JRC126319]]

Voor data providers is de architectuur complexer, met name door de data transformaties (bijv. coördinaatstelsel- en datamodeltransformaties), die uitgevoerd moeten worden om INSPIRE compliant data te leveren. Tevens zijn - naast het nationaal georegister - ook enkele generieke, ondersteunende voorzieningen beschikbaar, zoals een diverse registers (namespaces, coördinaatreferentiestelsels, begrippen, etc.) en validatietools.

INSPIRE afsprakenstelsel

INSPIRE bestaat uit een set van formele afspraken, een kwaliteitsraamwerk met diverse aspecten van data delen binnen de Europese geo-informatie infrastructuur (zie figuur 7.2).

Figuur 7.2 – Afsprakenstelsel Europese geo-informatie infrastructuur (INSPIRE)

De volgende afspraken maken deel uit van het gehele kwaliteitsraamwerk:

Formele afspraken over scope, te hanteren begrippen, generiek conceptueel model voor datamodellen, methodologie, technische architectuur en standaarden, en data encoding;
Formele afspraken over hoe data uniform beschreven moet worden tussen organisaties in verschillende lidstaten (o.a. tot in details uitgewerkte modelleer conventies voor opstellen van informatiemodellen, applicatie schema’s en uitwisselformaten), die worden toegepast t.b.v. data product specificaties voor 34 thema’s;
Formele afspraken over functionaliteit voor het uitwisselen van data via principes van service oriented architecturen en gestandaardiseerde service interfaces;
De (kwaliteits)beschrijving van datasets en services met metadata, zodat het zoeken-raadplegen-downloaden en aanroepen adagium van service georiënteerde architecturen wordt ondersteund;
De mogelijkheid voor conformiteitstoetsing t.b.v. EU rapportages op basis van Abstracte test Suites.
INSPIRE kent een aanpak met gedistribueerde verantwoordelijkheden en in combinatie enkele generieke, centrale voorzieningen, m.n. registers;
INSPIRE kent een aanpak van referentie architecturen, abstracte modellen en richtlijnen en uitgewerkte concrete (technische) handleidingen;
Deze formele afspraken zijn/worden door de stakeholders (gebruikers en data providers) zelf opgesteld. Draagvlak wordt daarmee verkregen en inhoudelijke discussies over content, modellen en standaarden beslecht;
Daarbij kent INSPIRE een implementatie roadmap.

Synthese

De Europese geo-informatie infrastructuur is als data space tot stand gekomen als het geheel van afspraken vastgelegd in wetgevende en technische documenten. In figuur 7.3 zijn de focusgebieden weergegeven, die van belang zijn geweest bij de totstandkoming van de Europese geo-informatie infrastructuur ofwel de data space op basis van het gehele (wettelijke) INSPIRE raamwerk.

Formele afspraken over hoe data uniform beschreven moet worden tussen organisaties in verschillende lidstaten), die worden toegepast t.b.v. data product specificaties voor 34 thema’s. Afspraken over data interoperabiliteit zijn vastgelegd in conceptuele kaders en technische uitvoeringsregels: scope, te hanteren begrippen, generiek conceptueel model voor data modellen, data formaten, methodologie voor data harmonisatie, technische architectuur en standaarden.

Figuur 7.3 - Focusgebieden INSPIRE als data space initiatief

INSPIRE beschrijft in technische uitvoeringsregels ook hoe de data uitwissel API’s moeten worden ingericht. Deze formele afspraken over functionaliteit voor het uitwisselen van data via principes van service oriented architecturen en gestandaardiseerde service interfaces zijn uitvoerig vastgelegd. Ook is een (kwaliteits)beschrijving van datasets en services met metadata ontwikkeld, zodat het zoeken-raadplegen-downloaden en aanroepen adagium van service georiënteerde architecturen wordt ondersteund. Daarbij is de mogelijkheid aanwezig voor conformiteitstoetsing t.b.v. EU rapportages op basis van Abstracte Test Suites.

Om datasets vindbaar te maken kent INSPIRE een aanpak met gedistribueerde verantwoordelijkheden in combinatie enkele (de)centrale voorzieningen: metadata catalogi (vindvoorziening via EU Geoportal) en zijn diverse ondersteunende Europese registers en nationale registers opgezet (woordenboeken, vocabulaires, namespaces, identifiers, coördinaatreferentiesystemen, etc. Voor het opzetten van registers is Re3gistry software ontwikkeld.

Daarbij ging de invoering van INSPIRE gepaard met een implementatie roadmap en governance structuur. De afspraken zijn door de stakeholders in de EU opgesteld. Draagvlak wordt daarmee verkregen en inhoudelijke discussies over content, modellen en standaarden beslecht (use cases, business models en community building). De implementatie is overgelaten aan de lidstaten en publieke organisaties in de lidstaten.

INSPIRE stelt geen eisen aan identiteit management, toegangs- en gebruikscontrole en schrijft geen contracten en/of policies voor behalve het kenbaar maken daarvan in de metadata. De EC is zelf hoeder van de data space via het wettelijke kader en beheert enkele generieke voorzieningen zoals de catalogus (EU geoportal) en diverse registers.

De Europese data strategie en ‘common data spaces’

Over de totstandkoming en realisatie van de Europese geo-informatie infrastructuur is onlangs een evaluatie verschenen. Deze evaluatie van de INSPIRE richtlijn, zal mogelijk leiden tot een nieuw voor te stellen GreenData4All. De GreenData4All richtlijn moet het makkelijker maken om data te delen tussen publieke en private partijen en met het algemeen publiek. Dit moet data gedreven innovatie en op feiten gebaseerde besluitvorming ondersteunen. De GreenData4All gerelateerde data zal zijn plek gaan krijgen in de Green Deal data space.

In het kader van de Europese Digitale Strategie en de Data Strategie zijn verschillende voorstellen voor wetgeving gedaan. Wij volgen deze Europese ontwikkelingen rondom wetgeving en houden deze bij in een Handreiking EU Informatie. De wetgevende en regulerende aspecten werken in op de implementatie van data spaces. Zo is eind februari 2022 het voorstel voor de Data Act (Data verordening) gepubliceerd, de laatste grote bouwsteen die nog ontbrak in de Europese data strategie. De Data Act regelt recht op data toegang voor consumenten en stelt regels over data delen, het voorkomen van oneerlijke contractafspraken, data portabiliteit tussen dienstverleners, interoperabiliteit tussen data spaces en diensten en het door overheden verkrijgen en gebruiken van data van bedrijven. Het geeft de mogelijkheid aan de Europese Commissie om additionele wetten te formuleren voor interoperabiliteit en standaarden.

De negen initiële gemeenschappelijke Europese data spaces zijn de volgende:

1. Een industriële data space, ter ondersteuning van het concurrentievermogen en de prestaties van de EU-industrie;

2. Een Green Deal data space, om het grote potentieel van data te gebruiken ter ondersteuning van de prioritaire acties van de Green Deal op het gebied van onderwerpen als klimaatverandering, circulaire economie, milieuvervuiling, biodiversiteit en ontbossing;

3. Een mobiliteitsdata space, om Europa in de voorhoede te plaatsen bij de ontwikkeling van een intelligent vervoerssysteem;

4. Een ruimte voor gezondheidsdata, essentieel voor vooruitgang bij het voorkomen, opsporen en behandelen van ziekten en voor geïnformeerde, op feiten gebaseerde beslissingen om de gezondheidszorgstelsels te verbeteren;

5. Een financiële data space om innovatie, markttransparantie, duurzame financiering, evenals toegang tot financiering voor Europese bedrijven en een meer geïntegreerde markt te stimuleren;

6. Een energie data space, om een sterkere beschikbaarheid en sector-overschrijdend delen van data te bevorderen, op een klantgerichte, veilige en betrouwbare manier;

7. Een landbouw data space, om de duurzaamheidsprestaties en het concurrentievermogen van de landbouwsector te verbeteren door de verwerking en analyse van data;

8. Data spacen voor overheidsdiensten, om de transparantie en verantwoording van de overheidsuitgaven en de kwaliteit van de uitgaven te verbeteren, corruptie te bestrijden, zowel op EU- als op nationaal niveau;

9. Een data space voor vaardigheden om de discrepanties tussen de onderwijs- en opleidingsstelsels en de behoeften van de arbeidsmarkt te verkleinen.

De Nationale geo-informatie infrastructuur

Dit hoofdstuk introduceert de Nationale Geo-Informatie Infrastructuur (NGII) als ‘data space’. We belichten het ‘data fundament’, de afspraken over standaarden voor interoperabiliteit, de bouwstenen en voorzieningen in de nationale geo-informatie infrastructuur.

De nationale geo-informatie infrastructuur

De geo-informatie infrastructuur is eigenlijk een internationaal concept, dat in de loop van de jaren invulling heeft gekregen in Nederland via wetgeving, afspraken en governance, standaardisatie en implementatie van centrale en decentrale voorzieningen en data platforms in vooral publieke organisaties.

Het ministerie van Binnenlandse zaken, verantwoordelijk voor de nationale geo-informatie infrastructuur, ziet de NGII als een datafundament onder de maatschappelijke opgaven, en sectoren die er gebruik van maken [[GeoInfo]]. De NGII bestaat allereerst uit de dingen, die het moeten doen: dataverzamelingen, voorzieningen en de werkprocessen om deze op orde te houden (blauwe blokken in de figuur 8.1). Daaronder de zaken die voorwaardenscheppend zijn: afspraken en standaarden om tot een samenhangend geheel te komen, governance om de gezamenlijke afspraken ook te kunnen maken, financiering om realisatie, beheer en onderhoud mogelijk te maken, en wet- en regelgeving om de hoofdlijnen vast te leggen op een manier die partijen bindt. In de pijl links het verbindende beleid, visie strategie en rechts de regie, sturing en communicatie op het geheel.

Figuur 8.1 – Nationale geo-informatie infrastructuur [[Geo-Info]]

De Nationale Geo-informatie Infrastructuur (NGII) omvat de geo-basisregistraties, voorzieningen als PDOK, en afspraken en standaarden, die in een aantal gevallen wettelijk geregeld zijn. Een aantal registraties die niet de status van basisregistratie hebben maar wel breed worden gebruikt, zouden hier ook toe gerekend kunnen worden. Daarvoor is onlangs een beleidsvisie opgesteld om te komen tot een nationaal geo-datafundament (zie verder paragraaf 8.3). Gebruikers participeren actief in het richting geven aan de basisregistraties en voorzieningen, dragen bij in de financiering, en leveren ook vaak een inhoudelijke bijdrage, bijvoorbeeld in de rol van data eigenaar en data provider door het doen van terugmeldingen aan de basisregistraties.

De NGII als publieke infrastructuur wordt bestuurd vanuit het Ministerie van Binnenlandse zaken en Koninkrijksrelaties. De huidige minister van Volkshuisvesting en Woningbouw is verantwoordelijk voor de geo-informatie en het geo-informatie beleid. Het GI-Beraad, waarin alle publieke partijen zijn vertegenwoordigd (diverse rijksoverheden, provinciale en lokale overheden), is het belangrijkste adviesorgaan voor de verantwoordelijk minister. Het beleid van de NGII is vastgelegd in Geosamen, een gezamenlijk initiatief van overheid, bedrijfsleven en onderzoeks- en onderwijsinstellingen. De bedrijven zijn vertegenwoordigd via branchevereniging Geobusiness NL en de onderzoeks- en onderwijsinstellingen door het Nederlands Centrum voor Geodesie en Geo-Informatica (het NCG).

De NGII is mede tot stand gekomen via wet- en regelgeving. Geo-informatie is op verschillende wijze in wetgeving verankerd, zowel internationale (bijvoorbeeld INSPIRE en diverse sectorale wetten) als nationale wet- en regelgeving (m.n. basisregistraties).

Dat heeft er mede toe geleid, dat in2009het nationaal georegister is opgezet, waarin inmiddels meer dan 8000 datasets van diverse rijksoverheden, de provincies, waterschappen en diverse gemeenten zijn geregistreerd om de toegang tot publieke geo-informatie te verbeteren. Daarbij zorgen diverse datavoorzieningen, zoals PDOK bij het Kadaster en het satellietdata portaal van het Netherlands Space Office (NSO) voor de toegang tot de data.

De standaardisatie van geo-informatie in de publieke sector is belegd en toegekend aan een onafhankelijke kennisinstelling (Stichting Geonovum) en voor de specifieke Nederlandse geodetische infrastructuur bij de Nederlandse Samenwerking Geodetische Infrastructuur (NSGI). De aandacht voor het juiste gebruik van coördinaatreferentiesystemen in geo-informatie(systemen) is belegd bij het Kadaster (als beheerder van Rijksdriehoeksmeting), Rijkswaterstaat (als beheerder van Normaal Amsterdams Peil) en de Hydrografische Dienst (primair gericht op het mariene deel van Nederland).

Synthese

In de afgelopen 15 jaar is de nationale geo-informatie infrastructuur als ecosysteem van vele partijen ontstaan en heeft geleid tot afspraken over allerlei aspecten over het delen van geo-informatie: de geo-basisregistraties, met API’s voor ontsluiting, catalogi voor vindbaarheid en standaarden voor interoperabiliteit, al dan niet vastgelegd in wetgeving. Ook governance is ingericht. In figuur 8.2 zijn de verschillende beschouwingsgebieden van de NGII als data space initiatief weergegeven.

De NGII heeft een cross-domein perspectief, zonder binding aan een bepaald toepassingsdomein maar aan diverse domeinen, waarin de geografische data over actoren, objecten, activiteiten en systemen in de werkelijkheid of fysieke leefomgeving een rol spelen. De werking en toepassing van de NGII zijn terug te zien in de uiteenlopende toepassingsdomeinen, zoals beheer en onderhoud van infrastructuur, watermanagement, mobiliteit, natuurbescherming, energietransitie, industrie, ruimtelijke ordening, woningbouw, landbouw, publieke administratie (bijv. belastingheffing).

Een eenduidige beschrijving van de NGII is eigenlijk niet beschikbaar. De NGII heeft bijvoorbeeld geen uniforme referentie architectuur, waarin de samenhang van de onderliggende bouwstenen is beschreven.

Figuur 8.2 - Focusgebieden NGII als data space initiatief

In 2020 heeft de NGII een ‘businessmodel’ gekregen met het rapport ‘Netherlands geolocation economy report’ [[BZK-GeoL]]. Dit rapport geeft inzicht in de Nederlandse geo-data-economie en de impact die deze data heeft op de economie.

Het rapport geeft een kort overzicht van enige geo-data technologieën en de voordelen van gebruik. Dit wordt gevolgd met een analyse, die de ‘geospatial readiness’ van Nederland ten opzichte van andere landen weergeeft. Hierbij scoort Nederland 4de in 2019. In 2022 verscheen een update van de internationale ‘geospatial knowlegde infrastructure readiness’ index en bleek Nederland de vierde positie te behouden na USA, het Verenigd Koninkrijk en Denemarken [[GW]].

Juridische overeenkomsten, die een rol spelen in de NGII zijn wet- en regelgevend en van toepassing op data delen, zoals de wetten voor de basisregistraties, de INSPIRE wet en de Wet Open Overheid (hergebruik van data). Conform deze wetgeving zijn uiteenlopende verplichtingen voor de overheden om data te delen en toegankelijk te maken. Onder de NGII an zich ligt geen juridische grondslag. Verschillende wetgevingen geven de NGII een juridische betekenis.

De interoperabiliteit van de NGII is geregeld via diverse afspraken. Het gaat om zowel standaarden voor data (informatiemodellen en formats), toegang tot data via API’s, als ook voor het vinden van data via metadata en coördinaatreferentiesystemen. Standaarden voor herkomst en traceerbaarheid zijn niet specifiek gemaakt. De standaardisatie van de NGII is verder geregeld via afspraken, zoals:

Standaarden voor de publieke sector worden aangeboden in het Forum standaardisatie (pas-toe-leg-uit lijst);
De ontwikkeling en het beheer van de geo-standaarden is de stichting Geonovum aangewezen, in nauwe afstemming met standaardisatie-organisaties, zoals OGC, ISO (TC211), W3C en de NEN (via de werkgroep NEN3610);
Het Raamwerk van geo-standaarden benoemt de vigerende geo-standaarden voor data (informatiemodellen), metadata, API’s, uitwisselformaten, visualisaties en coördinaatreferentiesystemen.

Vanuit het oogpunt van ‘data waarde’ heeft de NGII twee aspecten duidelijk uitgewerkt en geïmplementeerd in Nederland: metadata catalogi is een algemeen geaccepteerde voorziening bij publieke organisaties om geo-informatie vindbaar te maken voor (her)gebruik. Nationaal heeft dat geleid tot een nationaal georegister, waarin circa 8000 datasets te vinden zijn van diverse uiteenlopende publieke organisaties. Het nationaal georegister is verbonden met het open data portaal van de overheid, eveneens met het Europese geoportaal. De NGII kent diverse vocabulaires, thesauri en registers, zoals de conceptenbibliotheek voor informatiemodellen, technisch register voor geo-standaarden en een aanmerkingsregister voor organisaties met INSPIRE datasets. Een clearinghouse voor het loggen van transacties of een app store (marktplaats) kent de NGII niet. Wel heeft de NGII diverse voorzieningen, die de ontsluiting van geografische datasets via API’s verzorgen, waaronder het eerder genoemde PDOK en het satellietdata portaal.

In de NGII zijn geen of nauwelijks specifieke afspraken opgenomen voor het vertrouwd delen van data. Een specifiek vertrouwenskader ontbreekt. Vanuit het sterk publieke karakter van de NGII wordt voor de invulling van het vertrouwenskader geleund op de generieke afspraken in de publieke sector. Het publieke ‘open data’ beleid is hierbij richtinggevend geweest, waardoor een vertrouwensraamwerk niet van de grond is gekomen of niet nodig is geweest, zoals het inrichten van identiteit management en toegangs- en gebruikscontrole op basis van uiteenlopende ‘policies’.

De NGII is vooralsnog een publieke data space. Dat neemt niet weg dat vertrouwd delen van locatie gebonden data ook in specifieke use cases aan de orde is . In de praktijk worden daarvoor ‘datadeals’ gesloten ([[Geonovum]]). Zo hebben de Waterschappen een deal gesloten met een bedrijf dat satellietdata inzamelt om die data als open data beschikbaar te maken. En de VNG werkt aan leveringsafspraken met KvK, woningbouwcorporaties en met energiebedrijven om hun data herbruikbaar te maken door gemeenten. Voor het delen van data van derden m.n. niet-overheden kan een data space met een vertrouwenskader een oplossing zijn .

Van NGII naar geo-datafundament?

In de recent gepubliceerd beleidsvisie “Zicht op Nederland” wordt de transitie van de NGII naar het geo-datafundament voor de leefomgeving voorzien om grip te krijgen op de grote maatschappelijk opgaven in Nederland. De NGII en de daarin gelegen databronnen, afspraken en standaarden en voorzieningen vormen het data fundament waar de publieke partijen hun benodigde informatie op kunnen bouwen. Het biedt niet alleen een hoogwaardig, betrouwbaar en gedeeld beeld van de leefomgeving. Het functioneert ook als referentiepunt waar andere data mee kan worden verbonden, wat van cruciaal belang is voor het bredere datastelstel – zowel sectoraal, nationaal als Europees. ” In “Zicht op Nederland” [[BZK-ZoNL]] wordt geconstateerd dat de NGII is ontstaan in de afgelopen 20 jaar door de meest relevante basisdata ten behoeve van overheid breed gebruik. Belangrijke kern daarvan vormen de zes basisregistraties, die de meest gebruikte data uit de fysieke leefomgeving bevatten. Tezamen met diverse andere relevante data, standaarden, afspraken en voorzieningen vormen ze de NGII, dat het datafundament biedt waarop overheidsorganisaties hun beleid, besluitvorming en uitvoeringstaken baseren (zie figuur 8.3).

Figuur 8.3 – De NGII gevisualiseerd [[BZK-ZoNL]]

De NGII wordt niet alleen gezien als verbinder tussen sectoren, maar ook als verbinder in de Nederlandse data-federatie. In hoofdstuk 7 is een beeld geschetst van een Nederlands federatief datastelsel (de NL data-federatie) waarin locatie wordt beschouwd als één van de belangrijke sleutels voor het verbinden van data. Maar ook wordt in “Zicht op Nederland” geconstateerd dat de NGII ook een rol gaat spelen in de Europese arena van data spaces. “In veel van de door de Europese datastrategie beoogde dataruimten vormt de geo-informatie uit de NGII een essentieel element. Zo kennen de dataruimte green deal en dataruimten voor mobiliteitsdata, energiedata en landbouwdata een sterke afhankelijkheid van goede geodata” [[BZK-ZoNL]]. Deze visie leidt ook tot een concept’ van de samenhangende data’, een transitie om een integraal en rijk databeeld van de leefomgeving in 2D en 3D te creëren met mogelijkheden voor koppelbaarheid en flexibele uitbreidingsmogelijkheden. Dat wordt in gang gezet door een zestal datalagen te harmoniseren, standaardiseren en in samenhang te ontsluiten (zie figuur 8.4). Tot slot is in “Zicht op Nederland” ook de organisatie op orde gebracht; financiering, wet en regelgeving (“Wet geodata”) en samenwerking en governance met alle betrokken partijen om (de NGII en) het toekomstig data fundament, dat wordt omschreven als het verrijkte geheel aan samenhangende geodata uit zowel de basisregistraties als sectordata, tot stand te brengen.

Figuur 8.4 – De zes datalagen van de NGII gevisualiseerd [[BZK-ZoNL]]