|
Optikai karakterfelismerés – alapvetés 2010-03-03, 14.37:00
Nyomtatás |
PDF
Néhány alapvető tudnivaló a karakterfelismerésről.
Optikai karakterfelismerés
A különböző formátumú dokumentumok kezelésének egyik speciális esete, amikor a kezelendő dokumentumok még nem állnak rendelkezésre elektronikus formában. Ebben az esetben szinte mindig arról van szó, hogy a dokumentumok kinyomtatva, papír alapú hordozón jelennek meg.
Karakterfelismerési tevékenység végzéséhez értelemszerűen digitalizálni kell a még nem digitalizált, papíron nyomtatásban vagy írásban meglévő dokumentumokat, hogy ezután feldolgozható és elektronikusan szerkeszthető legyen. Ebben a szituációban kap szerepet az optikai karakter felismerés (OCR: Optical Character Recognition).
Az optikai karakter felismerés képes magas hatékonysággal a nyomtatott, papír alapú dokumentumokon lévő karaktereket felismerni.
Nyomtatott karakterek felismerése
Az alap kihívás itt az, hogy a nyomtatott papír alapú dokumentumok esetében nagy zaj hányaddal kell megküzdeni annak érdekében, hogy a releváns információt kihámozzuk az érzékelt jelek és minták közül. Nyomtatott dokumentum esetén zajnak tekinthető például egy apró folt a papíron, tinta elmosódás, tinta hiány, homályos háttér, apró gyűrődés a papíron, túl közeli vagy egybeolvadó betűk, betű dőlésszögének ingadozása.
Kézzel írt karakterek felismerése
Kézírás esetén a kihívás még nagyobb, hiszen itt a személyiségjegyek sokszínűségéből adódó írásminták kavalkádjából kell kihámozni a karaktereket. Mind a nyomtatott, mind pedig a kézírott esetben az optikai karakterfelismerő rendszer egy tanulási fázison átvesve képes olyan mintákat is osztályozni (értsd a megfelelő karaktert felismerni), amelyekkel a tanulási fázisban nem találkozott, tehát megvan a szükséges generalizációs képessége.
Az első üzleti alkalmazók egyike a bankok voltak, ők használtak először optikai karakterfelismerő rendszereket. Kezdetben speciális karaktereket dolgoztak ki annak érdekében, hogy a karakterfelismerő redszer dolgát megkönnyítsék.
A karakterfelismerést a számlafeldolgozási folyamatban is előszeretettel alkalmazzák – jöjjön el a „Pénzügyi-számviteli dokumentumok kezelése” konferenciánkra és nézze meg, hogy mire kell figyelnie és hogy hogyan könnyítik meg a munkáját a karakterfelismeréssel támogatott munkafolyamatok >>>
Optikai karakterfelismerés leírása a Wikipédiából, a szabad enciklopédiából.
Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) tehát azon eljárások módszere, melyek lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.
A felismerési folyamat részei:
az írás képének beolvasása (scanning);
a képen szereplő szövegblokkok, szövegsorok vizsgálata;
a blokkokban, sorokban szereplő betűk vagy betűpárok felismerése; és
a felismert szöveg ellenőrzése (például helyesírás- vagy nyelvtani ellenőrzés).
Ezen részek nem mindegyike kell, hogy szerepeljen egy OCR-programban, azonban mellőzésük rontja a felismerés hatékonyságát.
***
Kapcsolódó dokumentumkezelési és iratkezelési blogok
Dokumentumkezelés blog >>>
Dokumentumkezelési konferencia blog >>>
Dokumentumkezelési Akadémia 2010. évi tanfolyamai >>>
Hatékony pénzügyi-számviteli munka konferenciánkhoz kapcsolódó céges bemutatkozás
PontIT Üzletviteli Tanácsadó Kft. - céges névjegy >>>
Iron Mountain Magyarország Kft. - céges névjegy >>>
Kapcsolódó Dokumentumkezelés és Iratkezelés Portál cikk
Dokumentumkezelő rendszer ajánlati felhívás 1. rész >>>
Dokumentumkezelő rendszer ajánlati felhívás 2. rész >>>
Zebra az irattárban? - Vonalkódtechnológia a dokumentumkezelésben >>>
Nyomtatott karakterek felismerése a dokumentumok kezelésében >>>
Nem látványos - de fontos. Tudnivalók a bérszkennelésről. >>>
A KOFAX VRS (Virtual ReScan) képjavító technológia >>>
A dokumentumkezelés Lexikonja - színkiejtés és szkenner címszavak >>>
Iratkezelési rendszer kiválasztása >>>
Iratkezelés vagy dokumentumkezelés - szempontok rendszer bevezetéshez >>>
Karakterfelismerés felsőfokon >>>
***
Publikáló: Dokumentumkezelési és Iratkezelési Portál, dátum: 2010. március 3., Forrás: Wikipédia és Vázsonyi Miklós cikke a vazsonyi.hu-ról
|
|
|