Dokumentumkezelés, üzleti folyamat, ügyvitel - Dokumentumkezelési és Folyamatmenedzsment Portál - Hírek / Elektronikus dokumentumkezelés / Optikai karakterfelismerés (OCR) Lotus Notes dokumentumokban



Főoldal / Hírek / Elektronikus dokumentumkezelés
Optikai karakterfelismerés (OCR) Lotus Notes dokumentumokban
2009-03-26, 19.22:00

NyomtatásNyomtatás | PDF PDF

Az UniOffice Rendszerház Kft. Magyarországon egyedülálló, újszerű optikai karakterfelismerési technológiát fejlesztett ki IBM Lotus Notes/Domino környezetre.



Optikai karakterfelismerés (OCR) Lotus Notes dokumentumokban

Az UniOffice Rendszerház Kft. Magyarországon egyedülálló, újszerű optikai karakterfelismerési technológiát fejlesztett ki IBM Lotus Notes/Domino környezetre. Az eljárás újdonsága többek között az, hogy a rendszer képes automatikusan és felügyelet nélkül elvégezni a szövegfelismerést Lotus Notes/Domino dokumentumokban.

Dokumentum transzformáció

A megoldás a Lotus Notes/Domino rendszerben tárolt szkennelt iratokat, elektronikus faxokat és az egyéb kép formátumú állományokat akár teljesen automatikusan szöveges formátumba alakítja át, majd a többféle kimeneti formátum valamelyikében, például Microsoft Word vagy PDF formátumban elhelyezi az eredeti állomány mellett. A felismert szöveget a rendszer az eredeti iratnak megfelelően formázza és rendezi el. Az így kapott állományokat a felhasználók szabadon szerkeszthetik, formázhatják, átrendezhetik, valamint átmásolhatják és más iratokban újra felhasználhatják.

Full text keresés az „océerezett” szövegekben

Egy másik nagy előnye a funkciónak, hogy a szöveges formátumúvá átalakított iratok tartalma bekerül a Lotus Notes/Domino adatbázisok indexállományaiba. Így az eddig csak kép formátumban tárolt iratok - a Lotus Notes egyébként igen hatékony, teljes szöveges keresés funkciójával - a teljes szöveges tartalom szerint visszakereshetővé válnak. Ezután a beérkező elektronikus faxok és szkennelt iratok nem csak a küldő partner, iktatószám, stb. alapján kereshetők vissza, hanem a tényleges tartalom szerint is.

A technológia első implementációjában az UniOffice Rendszerház Beérkezett Faxok alkalmazását ruháztuk fel karakterfelismerési funkciókkal. A felhasználó egyetlen kattintással elküldheti az OCR kiszolgáló felé a beérkezett faxot, amelyet a rendszer rövid idő elteltével - ugyanabban a Lotus Notes dokumentumban - új fájlként helyez el az eredeti mellett. Természetesen gyakorlatilag bármilyen Lotus Domino alkalmazásban lehetőségünk van a technológia beépítésére.

A felhasználói igényektől függően elképzelhető teljesen automatizált, vagy interaktív megvalósítás is. Ha az alkalmazó vállalat szeretne pl. minden egyes iratot valamilyen szöveges formátumba is átalakítani, akkor az is megoldható, hogy teljesen automatikusan, bármiféle felhasználói beavatkozás nélkül a szkennelt iratok automatikusan bekerüljenek a Lotus Domino adatbázisba, és az irat képe mellett szintén automatikusan megjelenjen az irat szöveges dokumentummá alakított változata is. Interaktív megvalósítás esetén a felhasználó dönthet például a kimeneti formátum típusáról vagy a szövegfelismerés folyamatának paramétereit állíthatja be (pl. alapos vagy gyors felismerési mód, papírméret, mentési módok, képbeállítások, betűtípusok), de elképzelhető olyan opció is, hogy a felhasználó nem az eredeti állomány mellé kívánja elhelyezni a másolatot, hanem e-mailben küldi el saját magának.

Optikai karakterfelismerés – és több

Az alkalmazott dokumentumfelismerési technológia jelenleg 190 nyelvet támogat, ismer fel és ellenőriz automatikusan, különféle szótárfájlok és egyéb, díjnyertes technológiák segítségével. A szótárfájlok a felhasználó saját testreszabott Ms Word szótárfájljaival is kiegészíthetők. A dokumentumfelismerés különféle részterületekből tevődik össze:

- OCR (optikai karakterfelismerés) - összesen 190 nyelv, ezen belül 47 fő nyelv (magyar is) szótártámogatással, különféle szövegtípusokkal
- ICR (intelligens karakterfelismerés) - összesen 92 nyelv, ezen belül 23 fő nyelv (magyar is) morfológiai/szótártámogatással.
- OMR (optikai jelölésfelismerés) - kijelölések, körök, jelölőnégyzetek, buborékok, stb.
vonalkódok, eltérő szövegjelölési típusok, stb.
- speciális nyelvi és technikai ellenőrzési és korrigálási technológiák
- rengeteg kimeneti formátum (Microsoft Word, Excel 2007/2003/XP/2000/97/95, DOCX, XLSX, Microsoft PowerPoint 2003/XP, Microsoft Reader eBook (*.LIT), Rich Text Format, Text, Unicode Text, HTML, Unicode HTML, DBF, CSV; Unicode CSV, PDF/A, PDF (szöveg és kép, cask kép, szöveg a képen, szöveg a kép alatt), Microsoft Word 2003 XML)

Amennyiben Ön érdeklődik az UniOffice új megoldása iránt, kérjük vegye fel a kapcsolatot az UniOffice Rendszerházzal >>>.

***

Kapcsolódó Dokumentumkezelés és Iratkezelés Portál


Újabb tanúsított iratkezelési szoftver - Office GOV Ügykövetési rendszer >>>


Tanúsított iratkezelő és munkafolyamat-kezelő szoftver az Országos Atomenergia Hivatalnál >>>


Tanúsított iratkezelő rendszer bevezetése a Soproni Vízműnél >>>


Számlajóváhagyás az UniOffice Kft-től >>>


Verziókövetés a dokumentumkezelésben >>>


Unioffice Rendszerház – névjegy >>>


Tiszai Vegyi Kombinát, ahol nélkülözhetetlen a Notes >>>

***
Publikáló: Dokumentumkezelési és Iratkezelési Portál, dátum: 2009. 03. 27., Forrás: UniOffice