På gång: Språkbanken Sam bygger talsyntes för jiddisch

Språkteknologi är nödvändigt för att ett språk ska klara sig i dagens digitala samhälle. Just nu tar Språkbanken Sam fram talsyntes för jiddisch. Harald Berthelsen, språkteknolog, berättar.

Hur går arbetet till?

– Den stora utmaningen för minoritetsspråk är att det ofta saknas data: stora mängder inspelat tal och standardiserade uttalslexikon, till exempel. I arbetet med talsyntesen för jiddisch har vi utgått från REYD, ett forskningsprojekt och dataset som syftade till att stödja språkteknologi för jiddisch. Datasetet består av 4 892 korta ljudklipp på jiddisch och inspelningarna är gjorda av tre talare: två med litauisk jiddischdialekt och en med polsk jiddischdialekt. Det stora jobbet var alltså redan gjort. Vi har nu tränat om datasetet med text-till-talsystemet Piper.

Vilka utmaningar finns?

– När det gäller jiddisch är stavning en utmaning. En del språk har ljudnära stavning, till exempel finska. Jiddisch stavning är bara delvis ljudnära. Germanska och slaviska ord skrivs ljudenligt, men när det gäller ord med hebreiskt eller arameiskt ursprung skriver man inte ut vokalerna, så här behöver vi ta hjälp av lexikon för att se hur vokalerna ska läggas till. Vi behöver även ta reda på hur skiljetecken och siffror skrivs i jiddisch, till exempel.

Vad händer nu?

– Just nu finns en prototyp, en webbtjänst som man kan testa genom att klistra in texter och få ut en ljudfil. Målet är att utveckla den till en liten och enkel talsyntes som man ladda ner och köra på sin egen dator, till exempel för att spela upp Isofs webbsidor på jiddisch. Framöver skulle jag gärna vilja komplettera de äldre rösterna och göra nya inspelningar av yngre röster. Och målet är såklart att ta fram talsyntes för alla nationella minoritetsspråk.

REYD

Ett projekt för att utveckla text-till-tal (TTS) stöd för jiddisch

Läs mer om REYD Länk till annan webbplats.

Utforska REYD Länk till annan webbplats.

 

Talsyntes i fyra steg

  1. Samla in och förbered taldata. Spela in 10–20 timmar högkvalitativt tal och samla texter som täcker språkets ljud, ordformer och prosodi. Rensa inspelningarna och säkerställ att varje ljudfil har korrekt transkriberad text. Skapa en tal-till-text-korpus. Para ihop varje ljudklipp med text och metadata (talare, dialekt, inspelningsförhållanden).
  1. Bygg språkresurser: textnormalisering, uttal och fonem. Förbered texten (skriv ut förkortningar, hantera specialtecken), ta fram uttalslexikon och fastställ språkets fonemuppsättning.
  1. Träna talsyntesmodellen. Modellen lär sig hur text till ljud fungerar, inklusive uttal, betoning, rytm och intonation.
  2. Testa, finjustera och utvärdera. Korrigera fel, förbättra uttal och prosodi och genomför lyssningstester tills ljudet låter naturligt och stabilt.
Huminfras handbok

Publicerad den

Uppdaterad den

Språkbanken Sam
Språkteknologi