Hur fungerar OCR? Förklaras på ett enkelt och förståeligt sätt
I den här artikeln förklarar vi hur OCR fungerar. OCR står för "Optical Character Recognition" och kallas helt enkelt på tyska som textigenkänning. Detta innebär att en dator kan känna igen text på en skannad bild med OCR och sedan konvertera den till ett enkelt textdokument.
Så här fungerar OCR
Föreställ dig att du fick en papperspresentation från en kollega. Du vill nu redigera dessa på datorn eftersom du inte gillar enskilda passager. Så skanna det och gå till ditt OCR-program. Nu händer följande:
- Programvaran gör först en så kallad layoutanalys. För att göra detta tittar hon på sidlayouten och skiljer bilder från text. Hon noterar också deras position på sidan. Sedan räknas antalet stycken och individuella element som sidnummer sparas.
- Nu kommer den hårda delen. Programvaran tittar på de enskilda textblocken och delar dem upp i meningar. Meningarna delas sedan upp i enskilda ord och orden i bokstäver.
- OCR-programvaran innehåller mönster av bokstäver och tecken. Programmet jämför nu de skannade bokstäverna med dessa mönster. Om de är 99% lika, bestämmer algoritmen att det antagligen måste vara den bokstaven. Det är mycket exakt eftersom det kan jämföra många mönster på kort tid. På detta sätt skiljer han framgångsrikt mellan en "8" och en "B".
- Så bokstäverna och tecknen känns igen gradvis. Sedan kombineras de igen som ord och läggs tillbaka på sin plats i meningen. Så fort programvaran är klar sparas hela saken i ett normalt dokument, som du sedan kan redigera. Klart!
Vill du testa din programvarukunskap? Delta i vår stora programvaruquiz!