Månadens profil: Chris Haffenden

Hur kan vi skapa nya ingångar till kulturarvssamlingar med hjälp av AI-metoder? Och använda samlingarna för att skapa nya AI-modeller? Det är frågor som Chris Haffenden, idéhistoriker och forskningskoordinator på KB-labb, arbetar med.

Vad gör du på jobbet?

–Jag hjälper forskare att använda KB-labbs resurser och att hitta nya vägar in i Kungliga bibliotekets digitala samlingar. Jag samordnar ansökningar, löser praktiska hinder och kommunicerar om labbets utvecklingsprojekt. Jag arrangerar också workshops och evenemang för att sprida kunskap om våra verktyg och resurser och koordinerar även KB-labbs deltagande i Språkbanken och Huminfra.

Vad händer på KB-labb?

– Vi använder AI för att göra KB:s samlingar mer sökbara – och använder samtidigt samlingarna som träningsdata för att skapa nya AI-modeller för svenska. På så sätt visar vi det positiva samspel som uppstår när kulturarv och AI integreras. Eftersom svenska är ett mindre språk prioriteras det inte av de stora techbolagen när de tar fram nya modeller. Tack vare våra omfattande och högkvalitativa samlingar kan vi själva bygga en svensk grund för framtidens AI.

En utmaning är att vi sitter på en mycket värdefull samling svenskt data som vi av upphovsrättsskäl inte kan dela fritt utanför biblioteket. I stället tränar vi AI-modeller som är öppna att använda – som KB-BERT– en språkmodell för exempelvis analys av svenska tidningstexter, och tal-till-text-modellen KB Whisper. Tillsammans med Språkbanken Text har vi också utvecklat Kubord, en resurs som ger forskare tillgång till språkligt relevanta delar av modern tidningstext utan att de behöver resa till Stockholm.

Vad gör du just nu?

– Just nu tar jag fram en workshop vi ska ha i oktober inom Huminfra om multimodal topic modeling, det vill säga ämnesmodellering av bilder. Metoden gör det möjligt att i en stor bildsamling hitta teman och gruppera och sortera bilderna i olika kategorier. Det är praktiskt för kulturarvsaktörer som arbetar med stora bildsamlingar. Jag arbetar också med ett digitiseringsprojekt i samarbete med Riksantikvarieämbetet, Kulturminnesvårdens äldsta historia. Sverige har en lång tradition av kulturarvsarbete och material har samlats in sedan 1600-talet. Samlingarna är både efterfrågade och ömtåliga. Nu digitaliserar vi dem, både för att bevara dem och för att göra dem mer tillgängliga.

Vad driver dig?

– Att skapa nya ingångar till Kungliga bibliotekets samlingar och att öka förståelsen för hur man kan synka AI-metoder med kulturarvsmaterial och mer kvalitativt humanistiska frågeställningar. Vad händer när man sätter ihop dem? Vilka möjligheter finns? Hur kan vi samarbeta? Det handlar inte om att forskare ska beställa svar från tekniker utan om att olika perspektiv möts i samma rum och tillsammans utforskar vad som är möjligt. Det gör vi på KB-labb.

KB-labb

KB-labb är en nationell infrastruktur för forskning med utgångspunkt i KB:s samlingar. Sedan starten 2019 ger KB-labb forskare möjlighet att bedriva storskalig kvantitativ forskning på KB:s digitala samlingar av text, ljud, bild och video.

Läs mer om KB-labb som forskningsinfrastruktur Länk till annan webbplats..

Läs KB-labbs blogg Länk till annan webbplats..

Utforska KB-labbs fritt tillgängliga AI modeller Länk till annan webbplats..

Läs mer om Huminfras workshop om multimodal topic modeling. Länk till annan webbplats.

Utforska Bildsök Länk till annan webbplats.. En demo där Kungliga Biblioteket testar moderna bildsöksmetoder för att tillgängliggöra material som tidigare varit svårt att överblicka.

Läs mer om projektet Kulturminnesvårdens äldsta historia Länk till annan webbplats..

Läs mer om Kubord Länk till annan webbplats..

Publicerad den

Uppdaterad den

Språkbanken CLARIN
Språkteknologi
Chris Haffenden

Chris Haffenden, forskningskoordinator på KB-labb.