Hvad er forskningsdata?

Forskningsdata skal forstås bredt som data, men også beskrivelser af tilblivelsen af data. Der er altså tale om dokumentation for, hvordan data er kommet til verden. Genfinding sikres gennem metadata.

Research Data

 

Til grund for forskningsprocessen ligger materiale, der bearbejdes og analyseres videnskabeligt. I The Danish Code of Conduct for Research Integrity skelnes mellem primært materiale og data:

”Primary material is any material (e.g. biological material, notes, interviews, texts and literature, digital raw data, recordings, etc.) that forms the basis of the research. Data are detailed records of the primary materials that comprise the basis for the analysis that generates the results.”

Definitionen på data er ”records”, altså oplysninger, dokumenter, fortegnelser o.l. over de materialer, der danner grundlaget for forskningsresultaterne, herunder forskningsdata. Vi har altså et kontinuum, hvor yderpunkterne er henholdsvis forskningens slutresultater i form af data – og en række kilder til og oplysninger om disse slutresultater. De kan være baggrund, i form af tidligere forskning og data, den faglige eller samfundsmæssige kontekst for det pågældende forskningsprojekt, en konkret anledning til at udføre dette, fx en bestemt begivenhed. Sammen med dette hører også anvendte metoder til dataindsamling og analyse, teoretisk udgangspunkt osv. Kort sagt dokumentation, der giver indsigt i de nærmere omstændigheder for hvordan og hvorfor data er frembragt.

Genfinding af data

En vigtig del af forskningsprocessen er fremskaffelse af viden om hidtidig forskning inden for området. Heri indgår tidligere indsamlede og analyserede forskningsdata.

Genfinding af data foretages hyppigst ved hjælp af metadata, som er data om data. Bibliotekers informationer om en bog i et katalog er data om pågældende bog, som kan sikre, at den kan findes, og at låneren kan finde andre bøger, om samme emne, af samme forfatter osv.  De biblioteksmæssige metadata ses i den bibliotekspost, der vedrører et enkelt materiale. Her angiver biblioteker proveniens, såsom trykkested, år, udgiver, forfatter osv.  Der er ofte en emneklassifikation og emneord, der placerer materialet i en større forståelsesmæssig kontekst. Billedlig talt kan det sammenlignes med en placering på en hylde, hvor det enkelte materiale sættes sammen med andet materiale, der er emnemæssigt sammenfaldende, minder om eller på anden vis er relateret til.

Læs også artiklerne

Bevaring af forskningsdata

Særligt om problemer med at bevare på langt sigt

 

Henrik Vetter og Filip Kruse, Det Kgl. Bibliotek, december 2019