Möte om framtidens språkteknologi för små språk

Hur ser visionen ut för språkteknologi för minoritetsspråk i Skandinavien? 11–15 mars samlades representanter från Språkbanken Sam, Giellatekno/Divvun och Kvensk institutt i Tromsö för att diskutera vägen framåt. Jacob Larsson, språkteknolog på Språkbanken Sam, berättar.

Vad var syftet med arbetsmötet?

– Att diskutera hur vi kan samarbeta för att utveckla en språkteknologisk infrastruktur för nationella minoritetsspråk och skapa en långsiktig planering framåt. Tanken var att dra gemensamma lärdomar av det arbete som gjorts vad gäller ljudteknologi, korpusarbete, lexikografiskt arbete med ordböcker, tangentbord samt utvecklingen av regelbaserade språkmodeller. Norge är ett föregångsland när det gäller språkteknologi för minoritetsspråk. Deras kunskaper har vi stor nytta av i arbetet med att utveckla språkteknologi för små språk i Sverige.

Berätta om några höjdpunkter!

– Det var inspirerande att se hur långt de olika samiska språken har kommit. De har samlat in stora korpusar och börjat utveckla maskinöversättningsprogram och talsyntes, till exempel. Förutom att de startade tidigt är en framgångsfaktor att de samordnat arbetet mellan de olika samiska språken. Vidare har de kompetenta språkteknologer och språkvårdare som arbetar aktivt med att utveckla språkteknologi. Det ger resultat och arbetet är mycket viktigt för att stärka språken.

Att träffa Kvensk institutt var också väldigt givande. Kvänskan och meänkieli har inte bara väldigt nära språkliga band utan situationen för språken liknar även varandra ur flera perspektiv. De har kommit lite längre med att utveckla språkmodeller och vi har kommit lite längre med det lexikografiska arbetet. Vi kan båda dra stora lärdomar från varandra och hur vi jobbat med de här frågorna.

Det var också väldigt roligt att träffa alla jag hittills bara träffat på Zoom och att få sitta och jobba på plats tillsammans. Och Tromsö var en fantastiskt vacker och inspirerande plats.

Vad händer nu?

– Mötet gav flera konkreta resultat. Vi har bland annat lagt in vår ordbok för meänkieli i ett nytt gränssnitt, som är bättre integrerat med språkmodellen och där användare kan ta sig direkt från uppslag i ordboken till att söka i vår korpus (via Korp). Vi fick även en bättre inblick i hur hela infrastrukturen på Giellatekno/Divvun hänger samman och lärde oss hur vi exempelvis kan skapa tangentbord och hur vi kan använda språkmodellen för att bygga en stavningskontroll i framtiden.

Nu ska vi planera in fler möten på plats och jobba mer tillsammans inom Borealium, en portal som samlar alla verktyg och hjälpmedel för små, nordiska språk på en plats. I november planerar även Astin (Arbetsgruppen för språkteknologi i Norden) en konferens om språk och AI i Norden. Där kommer dessa frågor naturligtvis att återkomma.

Publicerad den

Uppdaterad den

Språkbanken Sam
Jacob Larsson

Jacob Larsson, språkteknolog på Språkbanken Sam. Foto: Rickard Domeij.