Dokumentumkezelés, üzleti folyamat, ügyvitel - Dokumentumkezelési és Folyamatmenedzsment Portál - Hírek / Bevezetési tapasztalatok / Karakterek (betűk, számok) optikai felismerése - egy definíció



Főoldal / Hírek / Bevezetési tapasztalatok
Karakterek (betűk, számok) optikai felismerése - egy definíció
2007-03-23, 08.20:59

NyomtatásNyomtatás | PDF PDF

Noha a definíció nem ad pontos felhasználhatóságot, mégis érdemes megtudnunk, hogy mi is az a karakterfelismerés, az optikai karakterek felismerése.

Az optikai karakterfelismerés (rövidítve OCR, az angol optical character recognition szavakból): a számítástechnikában azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.

A felismerési folyamat részei:
- az írás képének beolvasása (scanning);
- a képen szereplő szövegblokkok, szövegsorok vizsgálata;
- a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
- a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).

Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát.

Publikáló: DocuWorld, dátum: 2007. 03. 23., Forrás: Wikipédia >>>