Nytt verktyg förenklar transkribering

På HiC 2024, Huminfras första konferens 10-11 januari, presenterar Magnus Ahltorp på Språkbanken Sam ett nytt verktyg som förenklar transkribering.

Vilka är fördelarna med verktyget?

– För att dokumentera språk använder man oftast generella fonetiska verktyg för att göra anteckningar och specifika analyser. Många verktyg för transkriptioner är dock komplicerade både att arbeta med och att exportera data från.

Tanken med vårt verktyg är att det ska vara enkelt att använda. Man ska lägga energi på transkriptionen, inte på att lära sig verktyget. Målet är en kort inlärningskurva, och att de som talar språket efter en kortare utbildning ska kunna göra transkriberingen själva. Det här kan vara intressant för till exempel små språk med små resurser. Språkvårdare kan själva göra transkriberingar för att skapa underlag för en ordbok eller en grammatik, till exempel.

Hur fungerar verktyget?

– Det inspelade ljudet presenteras på en webbsida som man scrollar uppåt och neråt. Det gör det enklare att få en översikt av ljudet, utan att behöva zooma in och ut ur materialet.

Ljudfilen delas upp i ungefär 10 sekunder långa delar, som läggs under varandra. För att göra det enklare att navigera visualiseras varje del av ljudfilen av ett spektrogram som översiktligt visar språkljudens karaktär, vokaler, konsonanter och pauser.

Själva transkriberingen görs på tre nivåer, enligt allmänt accepterade lingvistiska principer. Den första är en detaljerad nedskrift av vad som sägs på språket. På den andra nivån skriver man samma sak, i samma ordning, fast med det språk man beskriver det på. Den tredje nivån är en fri översättning.

Jag tror att verktyget har stor potential, men ännu är det inte färdigt. Det ska utvecklas och gärna användas för att vi ska få syn på vad som fungerar bra och vad som kan förbättras. Jag hoppas få kommentarer och synpunkter på konferensen i januari.

Johan Frid

Magnus Ahltorp, språkteknolog och lingvist på Språkbanken Sam. Foto: Maria Skeppstedt.

Publicerad den

Uppdaterad den

Språkbanken Sam
Språkteknologi