Klassificera mera!
Datorers förmåga att läsa analog text är ofta mycket god: datorn kan tolka såväl tryckt text som handskriven. Men en förutsättning för att det ska fungera är en klassificering av bildytorna. Om det skriver Hanna Willdal, Erik Magnusson Petzell och Leif-Jöran Olsson i ett blogginlägg.
Blogginlägget fokuserar på datorers förmåga att tolka analog text, tryckt såväl som handskriven, med hjälp av OCR, Optical Character Recognition, och HTR, Handwritten Text Recognition. I båda fallen handlar det om att träna en datormodell att känna igen visuella mönster och översätta dem till digital text.
En klassificering av bildytorna är dock en förutsättning för en god teckenigenkänning; datormodellerna behöver instrueras och tränas för att kunna identifiera vad som är text och icke-text. Blogginlägget lyfter fram två projekt som exempel: ett som inriktar sig på layoutanalys av arkivformulär och ett som inriktar sig på dialogstrukturen i transkriptioner av dialektinspelningar, så kallade fonogramutskrifter.
Publicerad den
Uppdaterad den