Språkbanken undersöker AI och mänsklig analys

Hur kan man skapa den bästa kombination av maskinläsning och medborgarforskning? I år ska Språkbanken Sam undersöka hur AI-verktyg kan användas för den digitala arkivtjänsten Folke – utan att förlora den mänskliga analysen.

Under 2025 startade arbetet med att automatisk transkribera de 1 500 dialektinspelningar som finns i Folke Länk till annan webbplats.. Nu har Språkbanken Sam fått forskningsmedel för att se hur arbetet med AI kan gå vidare. Kamilla Kärrstedt, arkivassistent, berättar.

Vad är målet med utredningen?

– HTR-tekniken har blivit otroligt mycket bättre på kort tid. Det vi inte kunde föreställa oss för några år sedan är nu möjligt. Men hur ska vi utnyttja tekniken? Vilka verktyg ska vi använda och på vilket sätt? Och vilket material lämpar sig för den här processen?

Utgångspunkten är materialet i Folke och det första steget är att utreda hur vi i stor skala kan HTR-läsa och analysera scannade handskrivna dokument. Men vi försöker tänka ännu större och titta på olika materialtyper i Institutet för språk och folkminnens samlingar: dialektordslappar, indexkort, katalogkort och givetvis själva uppteckningarna i sig.

Målet är att ta reda på hur vi kan tillgängliggöra material i stor skala - och samtidigt behålla medborgarforskarnas engagemang. Medborgarforskarna hjälper oss att tolka ord, innebörder och händelser och sätta dem i en kontext. De har koll på dialektala ord och lokal kännedom om personer och platser. Den kunskapen kan inte AI ersätta.

Vilka utmaningar finns?

– De flesta institutioner med liknande uppdrag brottas med samma frågor: hur man kan göra stora mängder material tillgängliga – snabbt och med begränsade resurser.

Samtidigt finns en risk att vi automatiserar bort en del av det som skapar engagemang. Medborgarforskare gillar att lösa problem, inte att rätta AI. Den motivationen vill vi inte gå miste om. Vidare kan vi inte AI-analysera allt material, vissa dokument kräver mänsklig analys. Så vi kommer antagligen att arbeta med parallella spår och försöka hitta den bästa kombinationen av människa och maskin.

Vad händer nu?

– Just nu rekryterar vi en systemutvecklare med AI-kompetens som ska börja titta på frågorna. I december ska utredningen vara klar, men redan i oktober ska vi presentera utredningen på CLARIN-konferensen i Brighton. Det blir ett spännande år.

Publicerad den

Uppdaterad den

Språkbanken Sam
Språkteknologi
Kamilla Kärrstedt, arkivassistent på Språkbanken Sam.

Kamilla Kärrstedt, arkivassistent på Språkbanken Sam. Foto: Mikael Lundgren.