30. november 2023

Hvordan udvikler vi bedst en dansk ChatGPT?

kunstig intelligens

Udvikling af en dansk version af ChatGPT er et af de centrale spørgsmål, som danske forskere og udviklere inden for sprogteknologi forholder sig til i disse år. Derfor stod det også højt på på dagsordenen til Digitaliseringsstyrelsens og Center for Sprogteknologis fælles konference om sprogteknologi 23. november.

Foto: Shutterstock
Foto: Shutterstock

- Selv om store sprogmodeller som fx GPT-4 er markant bedre end sine forgængere, også på dansk, vil der altid være et sprogligt og kulturelt kvalitetstab, når de data, systemerne bliver trænet med, primært er engelske.

Sådan lyder det fra professor Bolette Sandford Pedersen fra Center for Sprogteknologi ved Institut for Nordiske Studier og Sprogvidenskab.

Sammen med Digitaliseringsstyrelsen var hun og hendes kolleger i sidste uge medarrangør af Sprogteknologisk Konference, som blandt andet satte fokus på udviklingen af dansk sprogteknologi.

Dansk sprogteknologi er ifølge arrangørerne vigtig af flere grunde, men især fordi:

  • Det sprogligt, socialt og kulturelt er afgørende, at vi sikrer et dansk og nordisk islæt i den nye dominerende sprogteknologi.
  • Vi ikke skal overlade udviklingen af vores alle sammens sprogteknologi til internationale techgiganter.
  • Vi som samfund har en demokratisk forpligtelse til at udvikle ny teknologi på en måde, så alle borgere uanset uddannelsesbaggrund kan være med.

Kommunal chatbot

Bolette Sandford Pedersen nævner kommunernes fælles chatbot Muni, som lingvist Liv Moeslund Ahlgren præsenterede til konferencen, som et godt eksempel på, at indsigt i sproglige, kulturelle og sociale forhold er væsentlige i udviklingen af de sprogteknologiske løsninger, som skal ud at virke i praksis:

- Selv om teknologien bag Muni i dag er delvist forældet og lige lovlig håndholdt, som oplægsholderen også selv påpegede, så  leverer chatbotten til gengæld i dag overvejende korte og præcise svar på en måde, så alle borgere kan forstå dem. Vi har en demokratisk forpligtelse til at få alle borgere med på den digitale vogn, som vi risikerer at glemme i begejstringen over ny teknologi. Og derfor er det risikabelt at overlade udviklingen alene til internationale techfirmaer, der ikke kender den danske kontekst og fx vores tillidsbaserede tilgang.

Derfor arbejder forskere og udviklere over hele Norden også på at lave lokale versioner af teknologien.

- Amaru Cuba Gyllensten fra AI-Sweden præsenterede arbejdet med udviklingen af en svensk/nordisk GPT og foreslog blandt andet et tættere samarbejde om sprogteknologi i Norden, fordi vores sprog ligner hinanden så meget. Det er en spændende tanke, og det giver os i hvert fald noget af den datavolumen, som vi mangler i forhold til gigantiske sprogmodeller som GPT-4, som har engelsk som sit primære sprog, siger Bolette Sandford Pedersen.

Blandt en række andre spændende oplæg præsenterede ph.d.-studerende Kenneth Enevoldsen og Lasse Hansen deres projekt Danish Foundation Models, som netop går ud på at udvikle sprogmodeller til dansk tale og tekst. 

Ombejlet konference

Det er nu tredje år i træk, at Digitaliseringsstyrelsen og Center for Sprogteknologi ved Københavns Universitet i fællesskab afholder en konference om sprogteknologi, og interessen har aldrig været større:

- De første år, vi holdt konferencen, var det primært fagfolk, der deltog, men interessen for sprogcentreret kunstig intelligens er steget eksplosivt efter lanceringen af ChatGPT, og i år var konferencen overtegnet på rekordtid, slutter professor Bolette Sandford Pedersen, der allerede glæder sig til næste års konference.

Kontakt

Professor Bolette Sandford Pedersen
Center for Sprogteknologi
Institut for Nordiske Studier og Sprogvidenskab
Mail: bspedersen@hum.ku.dk 
Telefon: 35 32 90 78

Emner