I Danmark har vi haft et af verdens bedste overblik over smittespredningen af de forskellige virusvarianter.
"Uden adgang til en supercomputer havde vi ikke kunnet analysere i nærheden af det antal prøver, vi gjorde. Dataene var for eksempel essentielle for at forudsige væksten af alpha-varianten i januar og derved sikre, at myndighederne havde data, der kunne understøtte beslutninger med vidtrækkende konsekvenser for samfundet og den enkelte borger," siger Mads Albertsen.
Han er professoren bag det projekt, der har stået for den grundige gensekventering af positive coronaprøver, der tidligt har kunnet opspore først den britiske alpha-variant og senere den indiske delta-variant.
CLAAUDIA har leveret ressourcerne
Arbejdet har været helt centralt i forsøget på at bremse smitten, og har betydet, at myndighederne nøje har kunnet overvåge smittespredningen i samfundet. Det er et arbejde, der i høj grad har fundet sted på supercomputeren kaldet AI Cloud i datacenteret på Aalborg Universitet.
"Det er CLAAUDIA teamet, der har leveret beregningskapacitet til projektet, og vi har også leveret en data scientist til at støtte projektet," siger Rasmus D. Jensen, der er digitaliseringspartner for forskning på AAU.
CLAAUDIA er Aalborg Universitets særlige enhed, der hjælper forskere med data management, data science samt den digitale forskningsinfrastruktur.
Alle positive prøver sekventeret på supercomputer
Det særlige ved den danske pandemiovervågning har været, at samtlige positive prøver er blevet gensekventeret. Og det skyldes projektet på Aalborg Universitet, hvor Mads Albertsen, der er professor på Institut for Kemi og Biovidenskab samt leder af Albertsen Lab ved AAU satte sit forskningsarbejde på pause og tilbød sin hjælp til Statens Serum Institut i marts 2020.
"Min forskningsgruppe har brugt AAUs AI Cloud tidligere, så da vi satte projektet i gang i marts 2020, skrev jeg til CLAAUDIA teamet for at sikre, at vi var på forkant med computerressourcer, og at vi kunne overholde GDPR-kravene til behandling af de sensitive data. De smed alt, hvad de havde i hænderne, og i løbet af få dage havde de bygget et custom setup, der passede til kravene i vores projekt," siger Mads Albertsen.
Nyt setup på 5 dage
Fra statsminister Mette Frederiksen lukkede landet ned den 11. marts 2020 gik der fem dage, så havde holdet stablet et sikkert beregningsmiljø på benene for Mads Albertsens hold.
"Vi satte alle kræfter ind på at få lavet et dedikeret miljø til det her projekt på vores AI Cloud, og sikre at det var skærmet med ekstra sikkerhedsforanstaltninger," siger Rasmus D. Jensen.
Albertsen Lab har selv en række computerressourcer til rådighed, men de kunne lynhurtigt se, at med det antal prøver, de skulle have sekventeret og analyseret, så var det ikke nok.
"AAU’s AI Cloud har været nødvendig for at kunne analysere de rå data i realtid, når de blev lavet på vores maskiner. Vores normale computere, med kraftige GPU grafikkort, kan analysere 100 prøver om dagen – vi skulle sikre, at vi kunne analysere mindst 1000 om dagen. Det krævede GPU musklerne fra AAU’s AI Cloud," siger Mads Albertsen.
Ekstra sikkerhed
Supercomputeren på Aalborg Universitet bliver kaldt AI Cloud, fordi den har en GPU-arkitektur og primært er beregnet til at arbejde med Artificial Intelligence. AI Cloud er desuden delte ressourcer for alle tilknyttet Aalborg Universitet. Men Mads Albertsens hold fik lov at springe køen over.
"Fordi det er et fælles system, så er der nogle ting, man skal være opmærksom på i forbindelse med sikkerhed. Så vi tog en del af vores AI Cloud og isolerede den udelukkende til Mads’ projekt, så det kun var dem, der havde adgang til det," siger Rasmus D. Jensen.
Derudover blev der foretaget en lang række andre sikkerhedsforanstaltninger. Projektet kørte udelukkende på et isoleret sikkert miljø, og der blev indført to-faktor login og en udvidet logning.
"Dataanalyse indenfor sundhedsdata koblet med AI sætter bare nogle voldsomme krav til, hvordan vi har styr på sikkerheden. Man skal sikre sig, at man har styr på, hvem har adgang til data, hvornår har de adgang til data, at data ikke kan flyttes ud af systemet, og at man har fuld sporbarhed gennem logning," forklarer Rasmus D. Jensen.
Derudover havde forskerne på AAU brug for at kunne dele data med både Statens Serum Institut og de danske hospitaler via krypterede sikre forbindelser.
Allerede etableret håndtering af sensitive data
"Arbejdet med sundhedsdata stiller nogle helt bestemte krav til sikkerhed, og det arbejde var vi allerede i gang med, fordi vi har oplevet en stigende efterspørgsel fra health care-forskningen," siger Rasmus D. Jensen.
Derfor var overvejelserne og arbejdet med, hvordan et sikkert miljø kunne bygges op, allerede i gang, men blev speedet op, da Mads Albertsen henvendte sig.
"Der, hvor det bliver komplekst, det er, når det er jura og databehandleraftaler på tværs af institutioner. Men når vi får data og behandler data lokalt, så er det nemmere at lave de foranstaltninger, der skal til for at sikre, at vi kan stå inde for sikkerheden," siger Rasmus D. Jensen.
Han understreger, at det i en krisetid har vist sig særdeles værdifuldt, at projektet ikke har skullet stå stille eller afvente, at jura eller sikkerhed kom på plads. En af ambitionerne med etableringen af det nationale HPC-landskab er da også, at der er styr på de juridiske og sikkerhedsmæssige aftaler imellem de forskellige universiteter og eksterne samarbejdspartnere.
Vigtigheden af national HPC
Projektet understreger i følge Rasmus D. Jensen, hvorfor det er vigtigt at have tilgængelige nationale HPC-ressourcer.
"Der er et behov for HPC, og der er også behov for, at vi har bygget nogle ressourcer op, så vi hurtigt kan komme i gang med forskningsprojekter og analyser," siger han.
Mads Albertsen er da også meget klar i mælet omkring betydningen af adgangen til en supercomputer for projektet.
"Det har været essentielt ikke at være begrænset af compute eller storage, og at det har kunnet opskaleres, når behovet voksede. Desuden har vi haft fantastisk support, der altid var klar til at hjælpe, når der for eksempel opstod problemer fredag kl. 22," siger han.
Kapaciteten skal være tilgængelig, det nytter med andre ord ikke noget, at hvis der opstår et akut behov, så skal kapaciteten først til at etableres.
"Det er også pointen i forhold til det nationale HPC-landskab, som vi bygger herhjemme. Opstår der en situation, som den vi har været igennem her, så skal der også bare være kapacitet til, at vi kan løfte sådan en opgave, når den er så samfundskritisk, som den er," siger Rasmus D. Jensen.
Rost af statsministeren
Statsminister Mette Frederiksen har rost forskerne på AAU, og blandt andet udtalt at: ”Det er jeres fortjeneste, at vi har styr på epidemien. I er Danmarks helte. I er i verdensklasse.”
I dag er projektet afsluttet og kører ikke længere på AI Cloud i en kælder på Aalborg Universitet, men blev i stedet overdraget til Statens Serum Institut den 30. juni 2021 og kører nu på deres "almindelige" cluster.