Dataportal helpt corona-onderzoekers gegevens uit te wisselen

Sinds de uitbraak van corona wordt er in Nederland op grote schaal onderzoek gedaan naar COVID-19 en het virus dat de ziekte veroorzaakt. In opdracht van en in samenwerking met ZonMw ontwikkelen Health-RI en GO FAIR Foundation een data-portal waarmee onderzoekers volgens de FAIR-principes gegevens over hun lopende studies vindbaar kunnen maken. Data-uitwisseling moet leiden tot een snellere oplossing van de coronapandemie.


Icoon 1

Wie
GO FAIR Foundation,
Health-RI en DTL 

Icoon 2

Wat
Oprichting van FAIR-dataportal en Virus Outbreak Data Network (VODAN).

Icoon 5

Wanneer
2020 – heden

Icoon 6

Investering
VODAN €50.000
FAIR-metadata €200.000
FAIR-dataportal €300.000

Case in het kort

  • Opzet van Virus Outbreak Data Network (VODAN) met FAIR-datapoints in Afrika en LUMC
  • Ontwikkeling van een FAIR-dataportal met ca. 100 door ZonMw gesubsidieerde COVID-19-studies
  • Data worden vindbaar, toegankelijk en herbruikbaar voor mens en machine
  • Privacy van patiënten en veiligheid van systemen gewaarborgd
  • Onderzoeksresultaten zijn per direct beschikbaar, waardoor tussentijdse samenwerking mogelijk is
  • Doel: FAIR-dataportal voor alle wetenschappelijke onderzoeken

Volgens Erik Schultes heeft de Leidse GO FAIR Foundation, waarvan hij internationaal wetenschappelijk coördinator is, al enkele jaren goede contacten met ZonMw. Zijn organisatie is erin gespecialiseerd om data op een ‘FAIRe’ manier uit te wisselen. FAIR staat voor findable, accessible, interoperable en reusable: oftewel data moeten vindbaar, toegankelijk en herbruikbaar zijn voor mens en in het bijzonder voor machines. Toen begin vorig jaar de coronapandemie uitbrak, besloten GO FAIR en ZonMw de handen ineen te slaan. Met een financiële bijdrage van de Philips Foundation werden zowel in het Leids Universitair Medisch Centrum (LUMC) als in enkele Afrikaanse landen zogenaamde FAIR-datapoints opgezet volgens de FAIR-principes. Schultes: “De bedoeling van dit Virus Outbreak Data Network (VODAN) was om vanuit deze opslagplaatsen dataresultaten uit te wisselen over COVID-19-onderzoek. In feite fungeren die datapoints als een enkelvoudige gezamenlijke database. Zo hebben we de vraag gesteld hoeveel COVID-19-patiënten er zijn gediagnosticeerd. Vervolgens kregen we het antwoord, terwijl de data op de oorspronkelijke plek bleven staan en de privacy van de patiënten gewaarborgd bleef.”

Aan het woord

Erik Schultes

‘De bedoeling van het Virus Outbreak Data Network is om vanuit FAIR-datapoints resultaten te delen over COVID-19-onderzoek’

Erik Schultes, internationaal wetenschappelijk coördinator van de Leidse GO FAIR Foundation

Workshops voor onderzoekers en datastewards

Een dergelijke vorm van open science wilde ZonMw ook realiseren voor de Nederlandse COVID-19-onderzoeken die zij zelf financiert. Daartoe gaf zij aan GO FAIR en Health-RI de opdracht een FAIR-dataportal te ontwikkelen. Schultes licht toe dat het doel is om een netwerk van FAIR-datapoints in het leven te roepen van waaruit alle gegevens van de COVID-19-onderzoeken in ons land zijn op te vragen, zodat onderzoekers onderling data kunnen uitwisselen. “Dat betekent wel dat de metadata van die studies, dus de beschrijvingen van de data in elk onderzoek, op een gestandaardiseerde manier moeten worden ingevoerd. Pas als computers dezelfde taal spreken, kunnen ze met elkaar communiceren. Om dat mogelijk te maken, hebben we M4M-workshops ─ Metadata for Machine-workshops ─ georganiseerd voor onderzoekers en datastewards. Zij moeten in feite het algemene vocabulaire opstellen dat nodig is om die FAIR-datapoints met wetenschappelijke metadata te voeden.”

Bouw van de portal

Anders dan de GO FAIR Foundation, die zich richt op de FAIR-principes in velerlei sectoren, houdt Health-RI zich vooral bezig met de infrastructuur die nodig is om gezondheidsdata toegankelijk te maken. Twee onderzoekers die onder de paraplu van Health-RI meewerken aan de nieuwe dataportal zijn Jeroen Beliën en Rita Azevedo. Beliën is universitair hoofddocent en computerwetenschapper bij het Amsterdam UMC en nu projectleider bij het inhoudelijk vormgeven van de dataportal. Azevedo is werkzaam bij de Utrechtse not-for-profit organisatie Lygature die zich bezighoudt met publiek-private projecten in de biomedische wereld. Zij managet dit project voor Health-RI en is verantwoordelijk voor de bouw van de portal. Beiden moeten ervoor zorgen dat COVID-19-onderzoekers de gewenste data via een visuele interface kunnen vinden en vervolgens opvragen. Dit doen ze in nauwe samenwerking met de Nederlandse Federatie van Universitair Medische Centra (NFU).

Data binnen een kwartier beschikbaar

Die metadata van COVID-19-onderzoeken wordt nu nog opgeslagen op een centrale website. Wanneer een onderzoeker een vraag indient, weten zoekalgoritmes die data te vinden. Data-architect Beliën legt uit dat dit proces in de nabije toekomst zal verlopen via FAIR-datapoints, zoals die eerder bij het LUMC en in Afrika zijn geïnstalleerd. “Het instituut waar een onderzoeker werkt, kan ervoor kiezen om voorlopig gebruik te blijven maken van die centrale website of om binnenkort zelf zo’n datapoint te installeren en dat te voeden met metadata. Zo kan iedereen in zijn eigen tempo aansluiten. Het mooie van die datapoints is dat de onderzoeksgegevens bij de bron blijven staan en dat met het concept Personal Health Train de datapoints worden afgespeurd op zoek naar data die nodig zijn om vragen te beantwoorden. Wanneer de eigenaar van de data via een bestelprocedure heeft bepaald of de vraag voldoet aan allerlei voorwaarden, zijn de gewenste onderzoeksgegevens na inloggen op een dasboard in te zien. Zo kun je de privacy van patiënten en de veiligheid van het systeem veel beter waarborgen.” De dataportal voldoet daarmee volgens Beliën aan de noodzakelijke privacy-eisen en security by design and by default. “Bijzonder is bovendien dat het om lopende onderzoeken gaat. Alle nieuwe informatie die wordt aangevuld, is al binnen vijftien minuten in te zien.”

Het huidige project beperkt zich tot COVID-19-data maar op termijn moet alle wetenschappelijk onderzoek ‘FAIR’ zijn

Standaardisatie is een uitdaging

In totaal gaat het momenteel om zo’n honderd door ZonMw gesubsidieerde COVID-19-studies die via de dataportal ontsloten moeten worden. Azevedo is erg enthousiast over dit project. Ze vindt het niet meer acceptabel dat onderzoeksdata in lades verdwijnen, zoals vaak gebeurt. “Ook is het een geweldige stap vooruit dat wetenschappers dankzij de nieuwe dataportal niet meer hoeven te wachten totdat onderzoeksresultaten van collega’s zijn gepubliceerd. Zo blijft iedereen up-to-date en is het zelfs mogelijk om tussentijds te gaan samenwerken. Door gezamenlijk op te trekken, bereik je veel eerder je doel, namelijk te komen tot een oplossing voor de coronapandemie.” Om dit alles te bereiken, is er nog een hoop werk te verzetten, weet Azevedo. Vooral de eerdergenoemde standaardisatie van informatie ziet ze als een enorme uitdaging. “Ieder ziekenhuis of onderzoeksinstituut pakte het in het begin van de coronapandemie op zijn eigen manier aan. Dit is logisch en menselijk maar dat maakt het wel extra moeilijk om nu met z’n allen op één lijn te komen. Veel van die standaarden zijn er nog niet.”

Onderzoeksdata: het nieuwe goud

Om datastewards ─ de data-experts van ziekenhuizen en onderzoeksinstituten ─ te helpen bij het FAIR maken van hun onderzoeksgegevens, is er een landelijke Data Stewards Interest Group (DSIG). Mijke Jetten, community manager datastewardship van het Dutch Techcentre for Life Sciences (DTL) faciliteert dit netwerk van datastewards. Dit doet ze samen met Health-RI. “Mijn rol in de COVID-projecten is de datastewards op weg te helpen met het standaardiseren van hun data volgens de FAIR-principes. Ik breng hen samen zodat ze kennis en ervaringen kunnen uitwisselen en elkaar kunnen helpen.” Volgens Jetten is het huidige project beperkt tot de COVID-19-data maar is het op termijn de opmaat voor FAIR-data in alle wetenschappelijke onderzoeken. “Dit is het streven van ZonMw. In dat geval zullen alle studies moeten voldoen aan de FAIR-principes. Om dat te bereiken zullen onderzoekers vijf procent van hun budget moeten uittrekken voor hun datastewards. Pas dan is het haalbaar om echt slim hergebruik te maken van onderzoeksdata, het nieuwe goud. Met onze FAIR-COVID-19-data zijn we bovendien een voorbeeld voor de wereld. We hopen dat onze standaarden voor COVID-metadata straks internationaal worden toegepast en gebruikt.”

Meer over Data-onderzoek

Deel deze pagina

Meer lezen