Månadens profil: Per Fallgren

Per Fallgren är doktorand vid avdelningen för tal, musik och hörsel på KTH. Han jobbar bland annat med att ta fram metoder för att kunna utnyttja den ljuddata som finns inom arkiv.

Hur är ditt arbete kopplat till Nationella språkbanken?
– Jag jobbar med metodutveckling inom Språkbanken Tal. Just nu är jag engagerad i projektet Tilltal som handlar om att ta fram automatiska metoder för att kunna komma åt de ljudinspelningar som finns i Isofs, Institutet för språk och folkminnens, arkiv. Isof har runt 25 000 timmar inspelat tal som nu digitaliseras parallellt med att vi tar fram metoder och verktyg. Jag har bland annat tagit fram ett prototypverktyg som vi kallar för Edyson.

Berätta mer om verktyget!
– Edyson hjälper till att effektivt utforska ljuddata, till exempel om du har en ljudfil som du inte vet så mycket om och undrar över vad det är för typ av ljud eller språk. Den informationen skulle ett taligenkänningsverktyg inte kunna berätta för oss. Edyson däremot tar ljudfilen och klipper upp den i olika segment och bildar sen kluster med datapunkter utifrån hur de låter. På så sätt kan vi till exempel skilja ut tal från musik, app­låder och skratt, hitta pauser eller sortera ut olika talare, säger Per och fortsätter:

– På så sätt är Edyson är ett schysst sätt att få en inblick i vad du har att göra med för typ av material. Istället för att du som forskare ska lyssna igenom en tio timmars lång inspelning, kan du använda Edyson som ett första steg och även se om något som sticker ut. Vi testade till exempel en ljudfil från Isofs arkiv som vi trodde innehöll ett samtal mellan en man och en kvinna, men Edyson visade att det hände något mer och det visade sig att mannen tog upp en fiol och började spela en bit in i samtalet.

Vilka är de tänkta användarna av Edyson?
– Vi fokuserar först och främst på de forskare som är intresserade av tal- och ljudmaterial inom projektet Tilltal, till exempel dialektala ljud. Tanken är att ge ett verktyg till forskare som inte har teknisk bakgrund för att de ska kunna utforska och göra spännande saker med ljudmaterialet från Isofs arkiv. Vi har bland annat en dialektforskare som kommer använda verktyget för att hitta och studera särskilda vokalljud.

Vad är målet?
– Målet är att komma med en teknisk tjänst som fungerar och som kan spara tid för forskare och ge mer exakta resultat jämför med att sitta och lyssna igenom en tio timmar lång inspelning. Men det är metoderna bakom verktyget som är det mest intressanta. I jäm­förelse med tra­ditionella me­toder kan det här spara enormt mycket tid, och då öppnar sig nya möjligheter för att forska på äldre ljudmaterial.

Under vinjetten Månadens profil presenteras personer vars arbete har anknytning till Nationella språkbanken.

Per Fallgren, doktorand vid Avdelningen för musik, tal och hörsel, KTH

Per Fallgren

Publicerad den

Uppdaterad den

Nyhet
Språkbanken Tal
Språkteknologi