logo
     Főoldal  |    Ajánló  |    Eseménynaptár  |    Fórumok  |    Letöltések  |    Oldaltérkép
   RSS








Optikai karakterfelismerés – alapvetés
2010-03-03, 14.37:00

NyomtatásNyomtatás | PDF PDF

Néhány alapvető tudnivaló a karakterfelismerésről.



Optikai karakterfelismerés

A különböző formátumú dokumentumok kezelésének egyik speciális esete, amikor a kezelendő dokumentumok még nem állnak rendelkezésre elektronikus formában. Ebben az esetben szinte mindig arról van szó, hogy a dokumentumok kinyomtatva, papír alapú hordozón jelennek meg.
Karakterfelismerési tevékenység végzéséhez értelemszerűen digitalizálni kell a még nem digitalizált, papíron nyomtatásban vagy írásban meglévő dokumentumokat, hogy ezután feldolgozható és elektronikusan szerkeszthető legyen. Ebben a szituációban kap szerepet az optikai karakter felismerés (OCR: Optical Character Recognition).

Az optikai karakter felismerés képes magas hatékonysággal a nyomtatott, papír alapú dokumentumokon lévő karaktereket felismerni.

Nyomtatott karakterek felismerése

Az alap kihívás itt az, hogy a nyomtatott papír alapú dokumentumok esetében nagy zaj hányaddal kell megküzdeni annak érdekében, hogy a releváns információt kihámozzuk az érzékelt jelek és minták közül. Nyomtatott dokumentum esetén zajnak tekinthető például egy apró folt a papíron, tinta elmosódás, tinta hiány, homályos háttér, apró gyűrődés a papíron, túl közeli vagy egybeolvadó betűk, betű dőlésszögének ingadozása.

Kézzel írt karakterek felismerése

Kézírás esetén a kihívás még nagyobb, hiszen itt a személyiségjegyek sokszínűségéből adódó írásminták kavalkádjából kell kihámozni a karaktereket. Mind a nyomtatott, mind pedig a kézírott esetben az optikai karakterfelismerő rendszer egy tanulási fázison átvesve képes olyan mintákat is osztályozni (értsd a megfelelő karaktert felismerni), amelyekkel a tanulási fázisban nem találkozott, tehát megvan a szükséges generalizációs képessége.

Az első üzleti alkalmazók egyike a bankok voltak, ők használtak először optikai karakterfelismerő rendszereket. Kezdetben speciális karaktereket dolgoztak ki annak érdekében, hogy a karakterfelismerő redszer dolgát megkönnyítsék.

A karakterfelismerést a számlafeldolgozási folyamatban is előszeretettel alkalmazzák – jöjjön el a „Pénzügyi-számviteli dokumentumok kezelése” konferenciánkra és nézze meg, hogy mire kell figyelnie és hogy hogyan könnyítik meg a munkáját a karakterfelismeréssel támogatott munkafolyamatok >>>

Optikai karakterfelismerés leírása a Wikipédiából, a szabad enciklopédiából.

Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) tehát azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.

A felismerési folyamat részei:

az írás képének beolvasása (scanning);
a képen szereplő szövegblokkok, szövegsorok vizsgálata;
a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).

Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát.

***

Kapcsolódó dokumentumkezelési és iratkezelési blogok


Dokumentumkezelés blog >>>


Dokumentumkezelési konferencia blog >>>


Dokumentumkezelési Akadémia 2010. évi tanfolyamai >>>


Hatékony pénzügyi-számviteli munka konferenciánkhoz kapcsolódó céges bemutatkozás


PontIT Üzletviteli Tanácsadó Kft. - céges névjegy >>>


Iron Mountain Magyarország Kft. - céges névjegy >>>


Kapcsolódó Dokumentumkezelés és Iratkezelés Portál cikk



Dokumentumkezelő rendszer ajánlati felhívás 1. rész >>>


Dokumentumkezelő rendszer ajánlati felhívás 2. rész >>>


Zebra az irattárban? - Vonalkódtechnológia a dokumentumkezelésben >>>


Nyomtatott karakterek felismerése a dokumentumok kezelésében >>>


Nem látványos - de fontos. Tudnivalók a bérszkennelésről. >>>


A KOFAX VRS (Virtual ReScan) képjavító technológia >>>


A dokumentumkezelés Lexikonja - színkiejtés és szkenner címszavak >>>


Iratkezelési rendszer kiválasztása >>>


Iratkezelés vagy dokumentumkezelés - szempontok rendszer bevezetéshez >>>


Karakterfelismerés felsőfokon >>>

***
Publikáló: Dokumentumkezelési és Iratkezelési Portál, dátum: 2010. március 3., Forrás: Wikipédia és Vázsonyi Miklós cikke a vazsonyi.hu-ról




   
Értékelés