19. september 2017

Snart er 6 millioner stykker sproglig kulturarv på nettet

Digitalisering

Rektor Henrik Wegener lagde vejen forbi NorS for at besøge de studenter som er kernetropperne i det kæmpe digitaliseringsprojekt som instituttet er ved at færdiggøre på rekordtid.

rektor på studenterbesøg 1

Lingvistikstuderende Caroline H.V. Boolsen fortæller om de leksikografiske udfordringer ved en digitalisering af et levende ordbogsværk som Ømålsordbogen, midt i udgivelsesprocessen.

Man skal aldrig lade en god krise gå til spilde – i hvert fald ikke helt! Så da dialektforskere, navneforskere og håndskriftforskere på det nyfusionerede Institut for Nordiske Studier og Sprogvidenskab kunne se frem til snart at blive beskåret kraftigt som følge af de skiftende politiske vinde, blev det besluttet at sætte turbo på digitaliseringen af de sprog- og kulturhistoriske skatte som instituttets samlinger udgør.

Processen med at digitalisere samlingerne har været i gang længe, og den har bl.a. affødt digitaliseringen af Danmarks Stednavne og Ordbog over det norrøne prosasprog, at digitale optagelser af danske dialekter i stort omfang bliver tilgængelige via bl.a. dialekt.dk, mens UNESCO-verdensarven fra Den Arnamagnæanske Håndskriftsamling bliver tilgængelig via handrit.is og formidlet via haandskrift.ku.dk.

Nød lærer nøgne studenter...

Som følge af nedskæringerne har instituttet dog ikke længere råd til at opbevare de fysiske samlinger i samme lokaler som det videnskabelige personale, og derfor skal det nu gå stærkt med digitaliseringen. Så i starten af 2017 blev der ansat 15 studentermedarbejdere til at gøre det grove arbejde med pakning, sortering, scanning og registrering af de omkring 6 mio. stk. arkivalier som de centrale dele af samlingerne omfatter – og som udgøres af en blanding af håndskrevne kartotekssedler og lydskriftoptegnelser, håndtegnede distributionskort – og ikke mindst analoge højkvalitetsfotos af de middelalderlige (og senere) håndskrifter.

rektor på studenterbesøg 2

Indoeuropæiskstuderende Simon Poulsen fortæller om det lærerige i til dagligt at studere for længst uddøde sprog hvor vi kun kender få hundrede belæg – og så at skulle arbejde med at digitalisere sprogsamlinger med hundredetusinder, og i nogle tilfælde millioner, af belæg.

Når det grove arbejde med scanningen og registreringen er udført, venter et ikke mindre krævende arbejde med at tilføje de metadata som også gør samlingerne søgbare. Ligesom det grove arbejde foregår det i tæt samarbejde med instituttets videnskabelige personale, og har man som studerende en forskerspire i maven, er det en gave at gå op ad erfarne videnskabsfolk til dagligt – og kunne trække på deres viden og erfaringer både over scanneren og over frokosten.

Snart er samlingerne frit tilgængelige

Resultatet skulle gerne begynde at dukke op på nettet i løbet af 2018: en gigantisk samling af sprogligt-kulturhistoriske data til fri afbenyttelse. Til en start vil søgemulighederne være begrænsede, og man skal nok have et vist fagkendskab for at kunne bruge dem i praksis. Sådan er vilkårene når det skal gå stærkt!

Men i takt med at instituttets samlede stab får knyttet flere og flere metadata til de scannede arkivalier – måske endda med hjælp fra den interesserede offentlighed? – vil søgemulighederne blive bedre. Så vil man f.eks. kunne søge på hvilke dialektord der er blevet brugt i specifikke sogne, og man vil kunne søge på hvordan markerne på ens hjemstavn har været navngivet i slutningen af 1600-tallet. Og har man mod på at læse middelalderlig håndskrift, vil man kunne søge på hvad der egentlig stod, skrevet med fjerpen, i de sagaer som vi ellers mest kender fra moderne oversættelser.