Månadens profil: Magnus Ahltorp
Magnus Ahltorp är språkteknolog och lingvist på Isof. Han är ansvarig för Språkrådets digitala lexikon, till exempel ordboken Lexin som snart lanseras i en ny version. Han utvecklar dessutom språkteknologiska verktyg för olika typer av språkligt material.
Vad gör du på jobbet?
– Den största delen av min tid ägnar jag åt digitala lexikon, till exempel vår jiddischordbok och vår meänkieliordbok. Den senaste tiden har det varit fullt fokus på den nätbaserade delen av Lexin, ett svenskt lexikon som har översättningar till nitton minoritetsspråk.
Lexin är vårt stora lexikon. Dels för att det innehåller många språk och många ord, men också för att lexikonet används i väldigt stor omfattning. I höstas gjordes i genomsnitt över 380 000 sökningar varje dag på den officiella webbsidan! Lexin gör också nytta på andra sätt. Vi har tillgängliggjort data och API, vilket innebär att Lexin kan stöpas om i nya former och är idag integrerat i många externa appar och webbsidor.
En del av min vardag går även åt till att utveckla verktyg som förenklar arbetet för forskare. Vi utvecklar fungerande prototyper för annoterings- och analysverktyg för olika typer av språkdata, exempelvis för stora textmängder, parallella texter och text kombinerat med inspelat tal.
Vi presenterar dessa på konferenser och i andra sammanhang, och de verktyg som väcker störst intresse arbetar vi vidare på och utvecklar stabilare versioner som andra sedan kan plocka upp och använda i sina forskningsprojekt.
Just nu är intresset störst för Topics2Themes, ett verktyg som gör det enklare att sortera och analysera stora mängder text.
Vad jobbar du med just nu?
– Just nu jobbar jag med att ta fram en ny webbplats för Lexin. Webbplatsen är över tio år gammal, och fungerar inte optimalt i mobilen. Den nya versionen fokuserar på att göra Lexin mer användbart på mobilen och i förlängningen även på stor skärm. Den första versionen beräknas vara klar i februari.
Lexin är ett tydligt exempel på vilken nytta digitala språkresurser kan ge. I slutänden gör ju ordboken det möjligt för människor att lära sig ett språk och delta i samhället.
Vad händer framöver?
– Massor. I dagarna ska jag och min kollega Marie Mattson hålla ett föredrag på ett lexikografiskt symposium i Oslo. Temat är hur lexikografiresurser kan bidra till att stärka nationella minoritetsspråk. Alla minoritetsspråk har inte tillgång till språkteknologer och lexikografer som själva talar språket. Vi måste därför ge stöd till talarna så att de kan göra arbetet själva.
I mars deltar jag på DHNB 2023, Digital Humanities in the Nordic and Baltic Countries Conference, och presenterar en metod vi kallar ordregn. Ordregn är en utveckling av ordmoln, bilder som synliggör vilka ord som är viktiga i en text. Ordregn använder olika språkteknologiska metoder för att detektera vilka ord som är viktiga och placera ut orden semantiskt så att ord som hör ihop ligger nära varandra. Eftersom temat för konferensen är hållbarhet har vi visualiserat innehållet i olika klimatrapporter.
Nästa steg är att undersöka hur ordregn bäst kan användas för att illustrera hur användbara våra lexikon är för olika texttyper. Det arbetet kommer vi att presentera på NFL2023, den 17:e konferensen om lexikografi i Norden som i år hålls i Bergen i maj. På samma konferens kommer vi också att presentera arbetet med Lexins nya mobilanpassade webbsida.
Publicerad den
Uppdaterad den