Höjdpunkter på CLARIN-konferensen

Den årliga CLARIN-konferensen gick i år av stapeln 16-18 oktober i Leuven, Belgien. Stian Rødven-Eide från Språkbanken Text var på plats och berättade om sitt avhandlingsarbete kring argumentation mining.

Vad handlade ditt föredrag om?

– Jag presenterade min avhandlingsforskning kring så kallad argumentation mining. Det är ett relativt nytt fält som handlar om att automatiskt identifiera och klassificera argumentation i text. Jag utgår från svenska riksdagsdebatter och har skapat en korpus som består av drygt 325 000 anföranden.

Att annotera argumentation är en utmaning. Min hypotes är att man kan göra det enklare genom att bygga kringliggande tjänster och annotering. Till exempel kan en kunskapsgraf över ledamöters deltagande i debatter tillsammans med namnuppmärkning ge en tydlig indikation på vem ett givet argument riktas till.

Min data har annoterats med lingvistisk information av Sparv och jag håller just nu på att evaluera modeller för namnigenkänning. Mitt nästa planerade steg är att ta tag i pronomina på samma sätt och därefter segmentera texten i mindre enheter.

Målet är att kunna se hur ledamöterna argumenterar i riksdagen. Eftersom korpusen sträcker sig från 1995 till 2018 kan vi titta på hur argumentation har ändrats över tid; är den till exempel mer saklig nu än tidigare? Eller finns det olika sorters argumentation beroende på parti, kön, ålder, kanske även skägglängd?

Nämn några höjdpunkter!

– Flera doktorander presenterade nya och intressanta metoder. En som jag pratade ganska mycket med var Guolin Fang från Reykjavíks universitet som jobbar med ett nytt sätt att förbättra talsyntes.

Presentationen Copyright in AI-generated Language Data var speciellt intressant. Det finns tydligen indikationer på EU håller på att röra sig bort från idéerna om monopol för upphovsrätt, till fördel för användarrättigheter. Upphovsrätt utgör stora hinder för språkteknologisk forskning, så det kan ge fler möjligheter till spridning och användning. Speciellt för minoritetsspråk är det ett stort problem när forskningen inte får tillgång till exempelvis fiktion eller tidningstexter.

CLARIN-konferensen

Clarin-konferensen samlar forskare och utvecklare som arbetar med den gemensamma forskningsinfrastrukturen runt om i Europa. Även andra forskare och intressenter från humaniora och samhällsvetenskap deltar i konferensen och i utbytet av perspektiv, tankar och erfarenheter kring språkbaserad e-vetenskap och arbete med infrastruktur. Läs mer om konferensen. Länk till annan webbplats.

Fotografi av Leuven.

Publicerad den

Uppdaterad den

Språkbanken Text
Språkteknologi