Siden etableringen af de nationale HPC anlæg i 2014 og 2015 har antallet af videnskabelige publikationer kun været stigende. Denne analyse blev første gang offentliggjort i DeiCs årsrapport for 2017, hvor ialt 290 publikationer blev registreret for perioden 2015-2017. Senere blev 60 publikationer efterregisteret for 2015-2017 og yderligere 226 publikationer er noteret for året 2018. Listen tæller således nu 576 publikationer for perioden 2015 til 2018, dvs. en fireårig periode.
Denne oversigt tegner et landskab af de videnskabelige publikationer som har inkluderet regnekraft fra et af de tre nationale HPC-anlæg hhv. indenfor Life Science (Computerome), multidiciplinær forskning (ABACUS2.0) samt samfundsvidenskab og humaniora (Kulturarvsclusteret).
Indhold på siden
- Indsamling af publikationer
- Nyt på den nationale liste
- Antal og fagområder
- Diversitet og gennemslagskraft
- Samarbejdsmønstre
- Hot topics in DK-HPC
- Fun facts
- Præsentation ved DeiC konferencen 2019
Indsamling af publikationer
Næsten 600 publikationer synliggør brugen af national HPC i dansk forskning i perioden 2015 til 2018, og dette billede kan ikke tegnes på normal bibliografisk vis. Mindre end 20% af publikationerne "fanges" ved en bibliometrisk søgning (Det er ikke skrevet i ”Acknowledgement” eller ”Funding” feltet i publikationen), og derfor har de nationale HPC brugere efterfølgende skulle angive specifikt, hvilken regnekraft de har benyttet.
I denne analyse er hver enkelt publikation blevet verificeret af HPC brugerne, for at få et retvisende billede af hvor mange publikationer, der reelt har inkluderet national HPC.
Nyt på den nationale liste
Listen inkluderer nu også publikationer fra samfundsvidenskab og humaniora, hvilket er nyt i forhold til analysen for 2015-2017. Det er især ABACUS2.0 der har været supercomputeren bag samfundsvidenskab og arkæologi (Fig. 1, Reference 2-7). Kulturarvsclusteret, også kaldet KAC, har været operationsdygtig siden 2018, og der forventes publikationer, der har inkluderet brug af KAC, i de kommende år. Dog har en forsker allerede kigget på det danske world-wide-web ved brug af KAC (Fig. 1, Reference 1). Hør om professor Niels Brüggers forskning i det danske web (Podcast) eller læs mere her (Nyhed).
Oversigt over publikationer sorteret efter årstal findes her (De første 500): PUB_ÅRSTAL
Antal og fagområder
- Siden lanceringen af de nationale HPC-anlæg, er der alene i 2017 og 2018 genereret 450 publikationer, der inkluderede brug af national HPC (Fig.2).
- De fleste HPC brugere ligger indenfor forskningsområderne Biologi (Blå, 29%), Kemi & Biokemi (Orange, 16%) samt Medicin (Gul, 30%) (Fig. 3A).
- Det ses, at den nationale HPC arkitektur understøtter hhv. Life Sciences forskning via COMPUTEROME (Fig. 3B) og multidiciplinær forskning via ABACUS2.0 (Fig. 3C). Kulturarvsclusteret, KAC, er designet til at understøtte hhv. humaniora og samfundsfag (Fig. 3D, Pt. kun én publikation).
- Regnekraft via ABACUS2.0 har især genereret publikationer indenfor disciplinerne Kemi & Biokemi, Fysik samt Computerscience & AI (Fig.4A).
- Regnekraft via COMPUTEROME har især genereret publikationer indenfor disciplinerne Biologi og Medicin (Fig.4B).
- Det samlede antal af publikationer er fordoblet fra 290 til nu 576 siden analysen blev foretaget første gang i 2017 (Fig.5).
Diversitet og gennemslagskraft
Her er information om synlighed og gennemslagskraft for de 576 publikationer, der inkluderede national HPC i perioden 2015 til 2018. Dette er belyst ved hjælp af feltvægtede citationer for publikationerne samt andel af publicering i top 10% mest citerede på verdensplan. Diversitet henviser til hvor bredt forskningsresultater er formidlet gennem forskellige tidsskrifter.
FWCI
I analysen for 2015 til 2018 benyttes parameteren feltvægtet citations index (FWCI) for hver enkelt publikation fra databasen Scopus og metrics modulet SciVal. FWCI er andelen af totale citationer for et givent antal publikationer divideret med det forventede antal citationer baseret på gennemsnittet for det pågældende videnskabelige område. Et FWCI på 1 lever op til det globale gennemsnit. For FWCI>1 er citationsgraden højere end forventet ift det globale gennemsnit. For FWCI<1 er citationsgraden mindre end det globale gennemsnit. En score på 1.6 betyder at publikationerne fik 60% flere citationer end verdens gennemsnittet for disciplinen.
JIF
En måde at rangere internationale tidsskrifter på, hvori videnskab publiseres (publikationer) er at måle på et citations index vha. JIF (Journal Impact Factor). En JIF på f.eks. 3 henviser til at i gennemsnit citeres videnskabelige publikationer fra pågældende tidsskrift 3 gange baseret på data fra de sidste to år. Det anskues at jo højere JIF for et tidsskrift jo mere videnskabeligt anset er pågældende publikation (McVeigh et al. (2009)).
- I alt 38.9% af publikationerne er at finde i de top 10% mest citerede publikationer i verden for 2015 til 2018 (Fig. 6A), hvilket er en høj rate. Dette bidrager til at øge gennemsnittet for Danmarks samlede bestand af publikationer i top 10% mest citerede på verdensplan, som i Forskningsbarometret 2018 var anslået til 19.4% for 2013 til 2017.
- I alt 36.5% af publikationerne er synliggjort i top10% af de mest citerede tidsskrifter på verdensplan (Fig. 6A).
- Den gennemsnitlige FWCI er 3,53 for de 576 publikationer der inkluderede DK-HPC, hvilket er højere end det globale gennemsnit og højere end det samlede antal af publikationer i DK (Fig. 6A).
- Publikationsanalysen for 2015-2018 viser højere felt-vægtet citations gennemslagskraft sammenlignet med total DK, Norden og OECD for 4 ud af 6 fagområder (Fig. 6B, Grøn kurve DK-HPC). Der er hidtil blot registreret 7 publikationer fra samfundsvidenskab og humaniora, hvilket kan forklare lav FWCI for disse områder.
- De 576 publikationer var tilgængelige i 299 forskellige internationale tidsskrifter. Dette understreger stor diversitet i udbredelse af forskningsresultaterne, da analysen fra 2015 til 2017 identificerede 290 publikationer i 168 tidsskrifter. Det indikerer, at det prioriteres at formidle sin forskning internationalt så bredt som muligt i nye tidsskrifter.
- I alt 99 publikationer (17%) er udgivet i højt anerkendte tidsskifter med JIF værdier over 10 (Tabel 1, Fig. 7). Ti publikationer er tilgængelige i tidsskriftet Nature og 5 stk. i Science. Desuden er der nu to publikationer i New England Journal of Medicine, som har en JIF på 70.
- En høj JIF score for tidsskriftet, hvori publikation er udgivet, er ikke ensbetydende med en høj synlighed (FWCI) for den enkelte publikation (Fig. 8 og 9, Top10 publikationer med angivelse af FWCI og JIF). Det ses f.eks. at de to mest citerede publikationer indenfor Life Science (FWCI>100) er fra tidsskrifter med JIF på 10, mens nr. 4 på listen er publiceret i tidsskrift med JIF på 70 (Fig. 8). Samme tendens ses for publikationerne udenfor Life Science området, hvor fysik er repræsenteret for hhv. Top1 (FWCI >15, JIF 5,3) og Top2 (FWCI >10, JIF 0,26), mens Top5 indenfor materialelære har FWCI på 8 og JIF på 6,8 (Fig. 9).
Links til Top10: 1, Szklarczyk, D. et al. (2015); 2, Szklarczyk, D. et al. (2017); 3, Wray, N.R. et al. (2018); 4, Manrai, A.K. et al. (2016); 5, Huerta-Cepas, J. et al. (2016); 6, Anttila, V. et al. (2018); 7, Gandal, M.J. et al. (2018); 8, Rebelo, A.R. et al. (2018); 9, Pedersen, H.K. et al. (2016); 10, Bekker-Jensen, D.B. et al. (2017).
Links til Top10: 1, Aoki, S. et al. (2017); 2, Drach, V. et al. (2018); 3, Papior, N. et al. (2017); 4, Cruz-Filipe, L. et al. (2017); 5, Boroviks, S. et al. (2018); 6, Ding, F. et al. (2017); 7, Cruz-Filipe, L. et al. (2017); 8, Hansen, M. et al. (2018); 9, Alexandersen, J. et al. (2018); 10, Ding, F. et al. (2016).
Samarbejdsmønstre
Her er information om samarbejdsmønstre identificeret i forfatterskab fra publikationerne hhv. nationalt (Samarbejde på tværs af universiteter), internationalt og med industri/ sektorforsknings institutioner. Samarbejde kan anskues som en måde til at udvikle nye kompetencer på - på tværs af universiteter og landegrænser.
- KU (n=262 af de 576 publikationer), DTU (n=199) og SDU (n=195) havde forfatterskabet på hovedparten af publikationerne, der inkluderede national HPC (Fig. 10). Andel af publikationer der udelukkende kom fra institutter fra et af de 8 universiteter er angivet med blåt, mens publikationer der inkluderede samarbejde på tværs af danske universiteter er angivet med orange.
- I gennemsnit var der i 67% af publikationerne internationalt samarbejde fordelt over 83 lande via mere end 3000 forsknings enheder fordelt på mere end 500 unikke institutioner (Fig. 11A). Samarbejdsmønstre pr. universitet ses i Fig. 11B i alfabetisk rækkefølge, og andelen af publikationer hvori det enkelte universitet er medforfatter på publikationen er angivet i Fig. 11C.
- Industri var repræsenteret i 12% af publikationerne, der inkluderede national HPC og sektorforskning var repræsenteret i 23% af publikationerne (Fig. 12A). I alt 194 publikationer, svarende til de 35% der inkluderede samarbejde med industri eller sektorforkning, akkumulerede over en fire-årig periode (Fig. 12B).
Hot topics in DK-HPC
Hvor fremtrædende og besøgt et emne er inden for videnskaberne (”Topic prominence”) kan udregnes ud fra antal citationer, citescore og ”views” i Scopus. Jo højere prominence percentile, jo mere er det et område, der er meget fokus på (Top10% ligger fra 0.9-0.99 percentile). Populært sagt kunne man sige, at et emne med høj prominence percentile med høj sandsynlighed er et ”hot topic” inden for en specifik videnskab. Det betyder ikke at forskning med lav prominence ikke er vigtig, der er bare ikke lige så meget fokus på området målt via ovenstående parametre.
- Nedenfor er vist en mere detaljeret oversigt over videnskabelige discipliner, der har brugt DeiC national HPC fra 2015 til 2018 (Fig. 13). Det ses at publikationer fra Computerome især henføres til life science og naturvidenskab (Røde cirkler, Fig. 13A). Publikationer fra ABACUS2.0 henføres til især computer science og fysik (Blå og lilla cirkler), men også social scienes er repræsenteret (Gule cirkler, Fig. 13B).
- Beskrivelse af ”Topic prominence Clusters” for hhv. ABACUS2.0 og Computerome findes i hhv. Tabel 1 og 2.
- Du kan finde flere detaljer i rapporten: LINK
Fun facts
Her findes flere detaljer om den forskning, der har benyttet national HPC i perioden 2015 til 2018 ud fra det indsamlede og brugerverificerede datasæt på 576 publikationer.
- Der er meget bevågenhed på ”Open Science”, men hvor mange publicerer egentlig deres resultater i et åbent tidsskrift?
I alt 59% af publikationerne i denne analyse er ”Open Access” ifølge Scopus. Dette indbefatter at publikationen enten a) er publiceret i et åbent tidsskrift eller b) der er betalt for at gøre publikationen åbent tilgængelig eller c) der er lavet en parallel publicering som frit tilgængeligt re-print ved siden af udgivelsen i et tidsskrift. - Hvilket videnskabeligt emne eller værktøj er mest belyst i de 576 publikationer?
I alt 54% af publikationerne inkluderede genom analyse vha. regnekraft på en national supercomuter. Genom analyser var benyttet på områder så som (Fig. 14):- Det humane genom. F.eks. diagnostisering og årsager til hjertekar sygdomme, kræft og diabetes, men også analyse af tarmflora (Microbiome), tvillingers genomer, urtidsmenneskers forekost og epigenetisk udtryk af det menneskelige genom m.m.
- Genomer fra plante og dyreriget. F.eks. kortlægning af genomer for mink, ulv og hest samt honningbi, gedehams og plante-ædende insekter.
- Genomer fra virus og bakterier. F.eks. microbiome fra mennesker og dyr, virus i spildevand, spredning af infektions sygdomme og antimikrobiel resistens fra toiletaffald i fly samt metagenomics af Grønlands isen.
- Hvor meget anvendes åbent software som f.eks. ”R” i de videnskabelige publikationer?
Ialt 20% af publikationerne inkluderede brug af ”R”, og mere end 100 unikke R-pakker var anvendt til data analyse. Se evt. tidligere analyse af R pakke landskabet HER.
Præsentation ved DeiC konferencen 2019
Præsentationen fra DeiC konferencen 2019 finder du her:
Analysen for 2015-2018 er lavet i samarbejde med de nationale HPC centre. Vi vil gerne takke Myhanh Nguyen, Tom Olsen og Desirée Suhr Pérez for at koordinere kontakten til HPC brugerne samt Jeannette Ekstrøm og Dorte Drongstrup for bibliografisk dataopsamling og input til metrics. Analysen er udarbejdet af Birgitte Vedel Thage, DeiC Kompetencecenter.