Folke blir korpus i Korp
Nu finns korpusen Folke i Korp. Det ger nya möjligheter för forskning, berättar Kamilla Kärrstedt och Hanna Willdal, arkivassistenter på Språkbanken Sam.
Från och med nu förs allt transkriberat material i den digitala arkivtjänsten Folke kontinuerligt in i ordforskningsplattformen Korp och så småningom i textanalysverktyget Strix.
– Texterna rör människors liv och leverne i allmogesamhället från 1800-talets mitt och framåt. Det är ett varierat material som handlar om folkliga föreställningar, traditioner, erfarenheter och minnen, till exempel hur man firade högtider eller gjorde för att få en god skörd, berättar Kamilla Kärrstedt.
Texterna är berikade med metadata och korpusen består för närvarande av 3 642 352 token och 235 713 meningar. Men korpusen är inte statisk, utan växer hela tiden. Varje månad transkriberas omkring 1 000 sidor arkivmaterial på Folke.
– Frivilliga medborgarforskare har lagt ner tusentals timmar på att transkribera. De hjälper oss inte bara med att göra samlingarna mer tillgängliga, utan sprider också materialet i olika sammanhang. Det är deras förtjänst att korpusen finns, säger Hanna Willdal.
Nya möjligheter för forskning
Den digitala arkivtjänsten Folke är en guldgruva för såväl forskare som en intresserad allmänhet. Att materialet numera finns tillgängligt i Korp innebär nya sökmöjligheter och främjar en datadriven forskning, säger Kamilla Kärrstedt.
– Korpusen är framtagen tillsammans med SB Text, och ett bra exempel på hur vi samarbetar inom Språkbanken och drar nytta av varandras kompetenser, säger Hanna Willdal.

Hanna Willdal och Kamilla Kärrstedt. Foto: Lena Wenner.
Publicerad den
Uppdaterad den