31. Optické rozpoznávání znaků

Opakování

Zápis (praxe-zapis.html) - doplnit html značky:


31. Optické rozpoznávání znaků
Optical character recognition (OCR) = rozpoznání textu z obrázků nebo fotek, resp. převod bitmapových obrazů do písmen, číslic, znaků
Postup:
1. získání bitmapových dat skenováním, fotografováním
2. vytvoření vektorových (křivkových) obrysů objektu (trasování) a porovnávání se vzory znaků (přiřazení objektu kódu znaku)
Software pro základní rozpoznání - např. OneNote, profi - Adobe Acrobat, ABBYY FineReader (ošetření konců řádků, slovníková kontrola, učení - využití AI)

Úvod - praktické ukázky optického rozpoznávání

OCR = optické rozpoznávání textu z bitmapových obrázků - obecný postup:

  1. získání bitmapových dat - skenování, fotografování
  2. a) porovnávání bitmapových objektů s bitmapovými vzory písmen, číslic, dalších znaků (velká chybovost)
    b) přesnější metoda - převod bitmapy do vektorů (vektorizace, trasování) - určení obrysu spojité oblasti pixelů se stejnou barvou, přesněji se stejným jasem a pak porovnávání grafických vektorových objektů se vzory písmen, číslic, dalších znaků

Demonstrace převodu bitmapa > vektor v Inkscapu

Rozpoznání textu = OCR

OCR souvislého textu

Specializovaný OCR software

Titulky (teorie viz kap. 21. Multimédia 2)