Danish Digitally Mediated Interaction (DanDIGI)

Sociale medier har i perioden siden årtusindskiftet markant ændret måden, vi bruger skriftsprog på i hverdagen. Digitalt medieret interaktion (også kaldet computer-mediated communication, CMC) er tæt integreret i vores sociale liv og danner grobund for nye udtryk såsom nye ord, alternativ stavning og tegnsætning, emojier og hashtags, og for at eksisterende sproglige konstruktioner bruges på nye måder.

Studier af digitalt medieret interaktion er derfor afgørende både for at forstå vores sociale liv i dagligdagen og for at generere og teste hypoteser om sprogforandring. Et af de interessante spørgsmål er, hvordan sprogbrugen påvirkes af de handlemuligheder (affordances), mediet stiller til rådighed, fx med hensyn til dialogicitet, opfattet formalitet og multimodale ressourcer.

Formål

DanDIGI-projektet har til formål at etablere et bredt sammensat tekstkorpus, som gør det muligt at benytte såvel kvantitative som kvalitative metoder i studier af sprogbrugen på sociale medier. Det vil sige dels korpuslingvistiske metoder, som søgninger efter sproglige strukturer og opstilling af konkordanser samt statistisk baserede sammenligninger af delkorpusser, dels nærsproglige analyser af sproglige strukturer i deres interaktionelle og multimodale kontekst.

Samtidig skal projektet danne grundlag for, at korpusset kan udvides med data fra andre projekter ved at grundlægge en solid digital infrastruktur.

Grundideen i DanDIGI er at udnytte og tilgængeliggøre datamateriale, som er indsamlet i forbindelse med andre projekter, herunder data indsamlet i forbindelse med forskningsprojekter tilknyttet Sprogforandringscentret. Ud fra det tilgængelige materiale udvælges data, sådan at korpusset bliver sammensat bredest muligt, både hvad angår typer af sociale medier og interaktionens karakter som offentlig, semi-offentlig eller privat.

Data

Da DanDIGI-korpusset er tænkt som infrastruktur for fremtidig forskning, dvs. en ressource som skal kunne bruges af mange personer, i forskellige øjemed og i lang tid fremover, følges FAIR-principperne for håndtering af forskningsdata (forskningsdatamanagement). Data vil i det omfang GDPR-reglerne tillader det, blive stillet til rådighed for forskere via Sprogforandringscentrets korpusinfrastruktur i løbet af 2026.

Finansiering

Carlsbergfondet (forskningsinfrastruktur, CF23-1008)

Projektperiode: 1. maj 2024 – 30. april 2026

Projektleder: Lektor Torben Juel Jensen

DanDIGI-projektets data

Medietype Platform Status Størrelse (tokens) Periode Kilde
Diskussionsforum Reddit  Offentlig 67 mio. 2014-2023 Academic Torrents (pushshift.io)
Heste-Nettet Offentlig 338 mio. 2000-2024 DanDIGI
Social netværks-side Twitter  Offentlig 21 mio. 2019-2020 Gigaword ("General discussions")
Facebook Semi-offentlig 1,5 mio. 2011-2019 Sprogforandringscentret
Instagram  Semi-offentlig ca. 150.000 2015-2018 Sprogforandringscentret
Besked-tjeneste Messenger Privat  1,5 mio. 2015-2019 Sprogforandringscentret

Forskere

Navn Titel Telefon E-mail
Andreas Candefors Stæhr Lektor +4535335747 E-mail
Liisa Deth Theilgaard Videnskabelig assistent +4535322889 E-mail
Philip Diderichsen Specialkonsulent +4535324189 E-mail
Tanya Karoli Christensen Professor +4535328493 E-mail
Torben Juel Jensen Lektor +4535328495 E-mail