Lyssna och läs samtidigt i Folke!

Nu har drygt 1 000 dialektinspelningar i Isofs digitala arkivtjänst Folke autotranskriberats med hjälp av modellen KB-Whisper. Det innebär att du kan lyssna på inspelningarna och samtidigt läsa vad som sägs.

Bakom arbetet med transkriberingen ligger Språkbanken Sam som i höst arbetar vidare med att generera texter till inspelningarna och att undersöka möjligheten att kombinera medborgarforskning och AI-verktyg för granskning och korrigering av transkriberingarna.

Testa verktyget

Filtrera på "Ljud" direkt innan sökning. Då visas alla inspelningar som prickar på kartan och i träfflistan. De inspelningar som har en automatiskt transkriberad text har en grön ikon bredvid titeln märkt "CC".

När du valt en inspelning du vill lyssna på klickar du på den. Längst till höger finns en knapp som heter "Avskrift".

När du klickar på ”Avskrift” öppnas ett fönster där du får den automatiskt transkriberade texten tillsammans med ljudinspelningen. Här kan du också välja att hoppa till valfritt segment i inspelningen, eller söka på särskilda ord i ett sökfält.

KB-Whisper är en svensk AI-modell för tal-till-text, utvecklad av Kungliga biblioteket (KB). Den bygger på OpenAI:s Whisper-modell men har finjusterats med över 50 000 timmar av svenskt tal, inklusive tv-sändningar, riksdagsdebatter och dialektinspelningar från Isof, digitaliserade av Språkbanken Sam.

Fakta om Folke

Folke är en digital arkivtjänst från Isof som lanserades år 2022. Här hittar du ett urval av Isofs äldre arkivmaterial som belyser människors liv och arbete, vardag och fest, erfarenheter och minnen från slutet av 1800-talet och framåt. I nuläget innehåller Folke drygt 20 000 accessioner som innehåller hundratusentals sidor folkminnesuppteckningar, och mer än 1 000 dialektinspelningar.

Utforska Folke Länk till annan webbplats.

Läs mer om Språkbanken Sams projekt med att kombinera AI och medborgarforskning

Publicerad den

Uppdaterad den

Språkbanken Sam
Språkteknologi