Danish Digitally Mediated Interaction (DanDIGI)
Sociale medier har i perioden siden årtusindskiftet markant ændret måden, vi bruger skriftsprog på i hverdagen. Digitalt medieret interaktion (også kaldet computer-mediated communication, CMC) er tæt integreret i vores sociale liv og danner grobund for nye udtryk såsom nye ord, alternativ stavning og tegnsætning, emojier og hashtags, og for at eksisterende sproglige konstruktioner bruges på nye måder.
Studier af digitalt medieret interaktion er derfor afgørende både for at forstå vores sociale liv i dagligdagen og for at generere og teste hypoteser om sprogforandring. Et af de interessante spørgsmål er, hvordan sprogbrugen påvirkes af de handlemuligheder (affordances), mediet stiller til rådighed, fx med hensyn til dialogicitet, opfattet formalitet og multimodale ressourcer.
Formål
DanDIGI-projektet har til formål at etablere et bredt sammensat tekstkorpus, som gør det muligt at benytte såvel kvantitative som kvalitative metoder i studier af sprogbrugen på sociale medier. Det vil sige dels korpuslingvistiske metoder, som søgninger efter sproglige strukturer og opstilling af konkordanser samt statistisk baserede sammenligninger af delkorpusser, dels nærsproglige analyser af sproglige strukturer i deres interaktionelle og multimodale kontekst.
Samtidig skal projektet danne grundlag for, at korpusset kan udvides med data fra andre projekter ved at grundlægge en solid digital infrastruktur.
Grundideen i DanDIGI er at udnytte og tilgængeliggøre datamateriale, som er indsamlet i forbindelse med andre projekter, herunder data indsamlet i forbindelse med forskningsprojekter tilknyttet Sprogforandringscentret. Ud fra det tilgængelige materiale udvælges data, sådan at korpusset bliver sammensat bredest muligt, både hvad angår typer af sociale medier og interaktionens karakter som offentlig, semi-offentlig eller privat.
Data
Da DanDIGI-korpusset er tænkt som infrastruktur for fremtidig forskning, dvs. en ressource som skal kunne bruges af mange personer, i forskellige øjemed og i lang tid fremover, følges FAIR-principperne for håndtering af forskningsdata (forskningsdatamanagement). Data vil i det omfang GDPR-reglerne tillader det, blive stillet til rådighed for forskere via Sprogforandringscentrets korpusinfrastruktur i løbet af 2026.
Finansiering
Carlsbergfondet (forskningsinfrastruktur, CF23-1008)
Projektperiode: 1. maj 2024 – 30. april 2026
Projektleder: Lektor Torben Juel Jensen
DanDIGI-projektets data
Medietype | Platform | Status | Størrelse (tokens) | Periode | Kilde |
Diskussionsforum | Offentlig | 67 mio. | 2014-2023 | Academic Torrents (pushshift.io) | |
Heste-Nettet | Offentlig | 338 mio. | 2000-2024 | DanDIGI | |
Social netværks-side | Offentlig | 21 mio. | 2019-2020 | Gigaword ("General discussions") | |
Semi-offentlig | 1,5 mio. | 2011-2019 | Sprogforandringscentret | ||
Semi-offentlig | ca. 150.000 | 2015-2018 | Sprogforandringscentret | ||
Besked-tjeneste | Messenger | Privat | 1,5 mio. | 2015-2019 | Sprogforandringscentret |
Forskere
Navn | Titel | Telefon | |
---|---|---|---|
Andreas Candefors Stæhr | Lektor | +4535335747 | |
Liisa Deth Theilgaard | Videnskabelig assistent | +4535322889 | |
Philip Diderichsen | Specialkonsulent | +4535324189 | |
Tanya Karoli Christensen | Professor | +4535328493 | |
Torben Juel Jensen | Lektor | +4535328495 |