Rapport från CALD-pseudo workshop på Malta

21–22 mars ägde CALD-pseudo workshop om datorbaserade metoder för pseudonymisering av språkdata rum på Malta. Elena Volodina, Maria Irena Szawerna och Ricardo Muñoz Sánchez på Språkbanken Text organiserade workshoppen och deltog med presentationer.

Hur kan vi effektivt pseudonymisera data så att individer inte kan identifieras, samtidigt som data blir användbar för forskning inom bland annat datalingvistik, lingvistik och naturlig språkbehandling?

Det var temat för CALD-pseudo workshop, som var en del av konferensen för den europeiska avdelningen av Association for Computational Linguistics (EACL).

– EACL var definitivt som en fan convention för datorlingvister! säger Maria Maria Irena Szawerna som presenterade en ny metod för att upptäcka känsliga element i texter på grundval av SweLL-pilot-korpusen.

Ricardo Muñoz Sánchez bidrag till workshoppen handlade om att undersöka hur olika associationer till förnamn kan påverka prestandan hos ett automatiskt system för bedömning av uppsatser.

Publicerad den

Uppdaterad den

Språkbanken Sam