EOSC-Nordic-projektet skal bidrage til at identificere problemer og løsninger i forhold til FAIR data (Findable, Accessible, Interoperable og Reusable).
Projektet er vigtigt fordi, de nordiske lande har stor fokus på Open Data, og mange nordiske aktører er allerede dybt involverede i EOSC-aktiviteter. Norden har desuden en stærk tradition for at samarbejde, og den nordiske vinkel er et vigtigt input til EOSC-processen.
- Læs mere om EOSC-Nordic her: EOSC-Nordic: Projektet, der skal bygge og integrere European Open Science Cloud i den nordiske og baltiske region.
I løbet af det første år af EOSC-Nordic-samarbejdet har deltagerne blandt andet kortlagt, hvor langt landene er med at implementere FAIR data-politiker jævnfør EOSC. Det er blandt andet blevet gjort ved at gennemføre en spørgeskemaundersøgelse.
- Læs mere her: 1 år: EOSC-Nordic har fødselsdag
Resultaterne viser blandt andet, at der generelt er opbakning til EOSC.
”Langt størsteparten af de forskningsfinansierende aktører, universiteter og forskningsinfrastrukturer stiller krav om Open Access, mens godt halvdelen stiller krav om Open Data,” fortæller Troels Rasmussen, der er Open Science Cloud Koordinator i DeiC og har været tovholder på den danske del af undersøgelsen.
Der tegner sig dog også et billede af, at fortolkningen af kravene i forhold til at stille data til rådighed i forhold til FAIR varierer en del.
”Kortlægningen viser, at der er ret forskellig tilgang i forhold til hvilke uformelle og formelle krav der stilles, hvad god data management er og lignende. En del af forklaringen på det er, at landene er på forskellige stadier i forhold til FAIR-implementering og at struktur og organisering varierer,” siger han.
Danmark har en god strategi
I den sammenhæng er Danmark ret godt med i kraft af, at vi er ved at udvikle en national data management-strategi med udgangspunkt i FAIR.
FAIR er vigtig i forhold til, at forskere kan finde interessante data, flytte dem derhen hvor analyseredskaberne er og ikke mindst for at kunne anvende data og publicere forskning på baggrund af dem. Dette er ekstra komplekst på tværs af fagdiscipliner, men også på tværs af landegrænser og infrastruktur.
”VI har gennemført en analyse, hvor vi tog 10 datasæt fra 100 repositorier på tværs af Norden og gennemført en computerbaseret vurdering af FAIR-modenhed. Resultatet var ikke overraskende, at der er et stykke vej endnu,” lyder analysen fra Troels Rasmussen.
I forhold til de parametre, der var stillet op, kunne 25 procent af datasættene ikke vurderes fordi disse savnede en unik identifikator – et såkaldt GUID (Globally Unique Identifier).
39 procent scorede under 30 procent positive indikatorer, mens godt en fjerdedel havde op til 50 procent positive indikatorer. 12 procent af datasættene opnåede en score på mere end halvdelen af de opstillede parametre.
”Der er en indikation af, at de institutioner der har data indsamling som primær opgave klarer sig bedre end andre. Det positive er, at med ret få midler vil man kunne øge FAIR scoren signifikant,” forklarer Troels Rasmussen.
Først og fremmest skal et datasæt have en unik identifikationsnøgle.
Derudover er der en del data repositorier, der kræver brugerregistrering for at anvende data. I forhold til FAIR-principperne er dette ikke hensigtsmæssigt, fordi et af målene er, at gøre data maskinlæsbare. Brugerregistrering bliver således en blokering, der kræver menneskelig intervention.
- Læs mere maskinlæsbare data her: M4M: Metadata for Machines gør automatisk deling af data mellem computere mulig.
Deling af følsomme data
Med hensyn til deling af data på tværs af grænser er det navnlig sensitive data, der er udfordringen, ikke mindst når der er tale om registerdata – altså data der er generet i den offentlige sektor som led i den offentlige administration.
”Vores analyse viser dog, at der egentlig ikke er juridiske barrier for at anvende data på tværs af landegrænser – GDPR er jo netop skabt for at muliggøre dette. Men ofte har offentlige og videnskabelige institutioner en meget restriktiv praksis inden for den lovgivning der er, hvilket er naturligt da data er følsomme,” vurderer Troels Rasmussen.
Der er tale om et komplekst område, og der er mange problemstillinger i forbindelse med de følsomme data, der skal tages højde for. Men information og uddannelse af data ejere-/data-operatører kan være nøglen til at give ensartede retningslinjer på området.
Der mangler en mere formaliseret struktur og processer, der kan understøtte dette og tydeliggør ansvarsfordelingen.
”En del af arbejdet i EOSC-Nordic er derfor også at dokumentere praktiske eksempler, hvor tingene fungerer godt i praksis, og bidrage til EOSC i forhold til løsninger, der måske ikke er tilstede i dag. Et særligt fokusområde i en nordisk kontekst er services for sensitive data” lyder det fra Troels Rasmussen.
Du kan læse meget mere om undersøgelsen og se alle tallene her.