Bajkó Csaba
Bajkó Csaba
Üzletágvezető
csaba.bajko@terc.hu
06 (1) 422-25-25
06 (70) 670-52-00
Dobos Róbert
Dobos Róbert
Rendszermérnök
robert.dobos@terc.hu
06 (1) 422-25-22
06 (70) 670-51-97

Dokumentumszkennerek

Számos alkalommal kérdezik a felhasználók, hogy mi a különbség a bevásárlóközpontokban kapható SoHo (otthoni kategóriájú) szkennerek és a dokumentumszkennerek között. Ez a kérdés azért is fontos, mert nem mindegy, hogy valódi dokumentumszkennerről beszélünk vagy olyan szkennerről, amely ugyan otthoni felhasználásra készült, de lehet vele dokumentumokat is szkennelni. A két dolog nem összekeverendő, hiszen nagymértékben különbözik egymástól.

Ügyfeleink számára az egyértelműbb pozícionálás és könnyebb érthetőség céljából készítettük az alábbi ismertetőt, amelyben megpróbáljuk összefoglalni azokat a fontosabb ismérveket, amelyek a dokumentumszkennereket leginkább jellemzik. Reméljük, hogy az alábbi ismertetővel segítünk ügyfeleinknek az archiválási feladatokhoz a legoptimálisabb szkennerek kiválasztásában.

 

Mitől dokumentumszkenner a dokumentumszkenner?

Az archiváló szkennerek elsődlegesen üzleti dokumentumok feldolgozására, archiválására szolgálnak, amely speciális követelményeket támasztanak a szkennerrel szemben.

Az archiváló szkennerek külön kategóriát képeznek a szkennerek nagy csoportjában (személyi, kiadványszerkesző, film, nagyformátumú stb.), így mint minden más kategória, ez is dedikáltan egy speciális feladatra van felkészítve, nevezetesen az üzleti dokumentumok mind nagyobb volumenű és hatékony feldolgozására.

Érdemes kiemelni, hogy az archiváló szkennerek nem elsősorban képeket, hanem inkább a képek által az adatokat olvassák szemben a többi típussal, ahol a nagy felbontás, a film adapter, a szín kalibráció, a családi fotókat rendezgető szoftver a fontos.  Persze ez kissé furcsán hangozhat, hiszen az archiváló szkennerek is “képből veszik” az adatokat, azonban az üzleti dokumentumok archiválása során nem az a fontos hogy az adott információ milyen színű papíron van, hanem az, hogy azon található információ mind hatékonyabban, mind nagyobb százalékban legyen feldolgozható, értékelhető.

Úgy is mondhatnánk, hogy az információ az elsődleges érték, nem pedig annak a megjelenése. Az információ az, amely bekerül az indexelő adatbázisba, a karakterfelismerő rendszerbe, a dokumentum-feldolgozás folyamatába, az információ az, amely üzleti értéket képvisel, ha szükség esetén azonnal rendelkezésre áll. Természetesen a kép is része az archívumnak, tehát az archiváló szkennerek a képminőség terén is kimagaslót kell produkáljanak, de ez a felhasználási területből (például tömeges, gyors szkennelés) fakadóan általában mást jelent mint a többi szkenner esetében.

 

Papírkezelés, papíradagolás

A szkenner papírbeviteli tulajdonságait nagymértékben befolyásolja a lapadagoló kialakítása, az adagolóban lévő görgők, érzékelők és más komponensek anyaga, technológiája stb. Pusztán síkággyal rendelkező dokumentumszkenner nincsen, a dokumentumszkennerek vagy lapadagolóval és síkággyal rendelkeznek, vagy csak lapadagolóval. Általánosságban elmondható, hogy az egyenes papírpályával rendelkező lapadagoló megbízhatóbb adagolást biztosít, mint a V alakú papírpálya.  Lapadagolóval ellátott szkennernél az adagoló kapacitása (az adagolóba egyidejűleg helyezhető lapok száma) egy fontos mutató, hiszen ez a naponta feldolgozható dokumentum mennyiséget is befolyásolja. Szintén fontos szempont a szkenner adagolójával feldolgozható dokumentumok súlya vagy vastagsága, ezt általában g/m2 vagy mm tartományban szokták megadni. Minél nagyobb ez a tartomány, a szkennerrel annál többféle dokumentumot tudunk feldolgozni.  

 

Beviteli felbontás

Az otthoni felhasználásra vagy színes fotók szkennelésére gyártott szkennerek esetében fontos a nagy felbontás, ezért ezeknél a szkennereknél nem ritka a több ezer dpi felbontás. A dokumentumszkennerek esetében azonban figyelemmel kell lennünk arra a tényre, hogy a felbontás növelésével a fájlméret is növekszik, méghozzá négyzetes mértékben. Figyelembe kell vennünk azt a tényt, hogy míg egy fotószkennerrel átlagosan napi max 40-50 fényképet lehet beszkennelni (ez már csúcsterhelés ezen szkennerek esetében), addig a dokumentumszkennereknek naponta akár több száz vagy több ezer dokumentumot kell beolvasni, esetenként ezeket a fájlokat interneten vagy belső hálózaton keresztül továbbítani. Magától érthetően, ha napi több ezer dokumentumot próbálnánk több száz vagy több ezer dpi felbontással beszkennelni és hálózaton vagy interneten keresztül továbbítani, akkor ez az indokolatlanul nagy fájlméretek miatt rendszer drasztikus lassulásához, esetenként teljes leállásához vezetne. A dokumentumokról kinyerhető adatok szempontjából a magasabb felbontással való szkennelés semmiféle többletinformációval nem jár, ezért nem a maximális, hanem az optimális felbontást kell megtalálni, amely az egész rendszer megbízható, azaz pontos adatokkal feltöltött és hatékony, gyors működését jelenti. A fentiek alapján érthető, hogy a dokumentumszkennerekben leggyakrabban alkalmazott felbontás 200-240 dpi, ennél nagyobb felbontásra ritka esetben van szükség.

 

Színkiejtés

Számos dokumentumfeldolgozó rendszer képes kiejteni a beszkennelt dokumentumokon lévő színeket. Az űrlapokon lévő színes keretek és vonalak célja, hogy megvezessék a kitöltő személy írását, így a kitöltött információ fix pozícióba kerüljön a dokumentumon a hatékony szövegfelismerés céljából. A feldolgozás során azonban ezekre a színes cellákra, vonalakra már nemcsak szükség nincsen, hanem kifejezetten károsak, ugyanis a keletkező fájlméretet növelik, a szövegfelismerő rendszerek hatásfokát pedig csökkentik. Ezért a dokumentumszkennerek esetében alapvető követelmény ezeknek a színeknek az optikai úton történő kiejtése, azaz elhagyása. A dokumentumszkennerek által tipikusan kiejthető színek (drop-out colors) a piros, zöld és kék színek (R,G,B), de a gyártók folyamatos fejlesztéseinek köszönhetően a mai modern dokumentumszkennerek már tanítható színkiejtésre is képesek, azaz bármilyen három színt képesek automatikusan kiejteni.

 

Küszöbszint (Threshold)

Jóllehet a legtöbb dokumentumszkenner ma már színes, a gyakorlatban azonban a nagytömegű feldolgozás tipikusan 1 bites, fekete-fehér üzemmódban történik. Amikor egy dokumentumot fekete-fehér üzemmódban olvasunk be, a szkennernek a dokumentum minden egyes képpontjáról el kell döntenie, hogy azt fekete vagy fehér képponttá alakítsa át. Ennek eldöntéséhez a küszöbszintet (Threshold) használják, amelyen átbillenve a képpont bizonyos mértékű sötétségi fok felett fekete, míg bizonyos világossági fok alatt pedig fehér lesz. A dokumentumszkennerek erre külön beépített technológiát tartalmaznak, hiszen az 1 bites fekete-fehér üzemmódban beolvasott képből is ugyanúgy ki kell nyerni minden információt, mintha az szürkeskálás üzemmódban lett volna beszkennelve. Optimális esetben ezeket a technológiákat a szkennerek beépítve tartalmazzák és nem külön szoftverek segítségével érik el ugyanazt az eredményt.

 

Kivételkezelés

Léteznek olyan dokumentumok, amelyek állaguk miatt a szkennerek görgős adagolóival nem dolgozhatók fel. Ilyenek például a nem szétszedhető, többoldalas dokumentumok, könyvek, útlevelek vagy mondjuk a közjegyző által nemzeti színű szalaggal összekötött, lepecsételt dokumentumok. Az ilyen esetekben síkággyal is rendelkező dokumentumszkennerre van szükség, hiszen ezek a dokumentumok fizikailag nem megbonthatók. A síkágyas dokumentumszkennerek síkágyáról beolvasott képek ugyanolyan feldolgozáson mennek keresztül (színkiejtés, küszöbszint meghatározás stb), mintha azt a lapadagolóval szkenneltük volna be. Fontos kiemelni, hogy a síkágyas beolvasás sebessége ebben az esetben sem összehasonlítható egy otthoni felhasználásra vagy fotók szkennelésére szánt síkágyas szkenner sebességével, ugyanis egy A4-es oldalt mindössze 1-2 másodperc alatt képesek beolvasni anélkül, hogy szükség lenne előnézeti képekre vagy bármilyen más előzetes műveletre.
 

Duplabehúzás ellenőrzés

A lapadagolóval történő tömeges feldolgozás esetén néha előfordul, hogy a szkenner adagolója két papírt tölt be egyszerre. Ez lehet attól, hogy a dokumentumok tűzőkapoccsal össze vannak tűzve, a dokumentumon rajta maradt egy Post-it vagy éppen sztatikusan egymáshoz ragadt két vékony papírlap. Ilyenkor nagyon fontos, hogy az operátor időben értesüljön az ilyen eseményről és ne utólag derüljön ki, hogy a több ezer beszkennelt oldalból hiányzik néhány darab, mert ezeket utólag manuálisan megkeresni jóval többe kerül, mintha a szkenner azonnal megállna vagy értesítené az operátort a kettős lapbehúzás tényéről. Az ilyen események detektálására többféle módszer létezik. Némelyik szkenner nem tartalmaz erre külön érzékelőket (ez ritka a dokumentumszkennerek között), hanem a beszkennelt dokumentumok hosszúsága alapján próbálja eldönteni, hogy történt-e kettős lapbehúzás. Amennyiben a sok egyforma (definiálható) hosszúságú dokumentum közé bekerül egy olyan, amely a többihez képest jóval hosszabb, akkor azt a szkenner kettős lapbehúzásnak minősíti. Ennek a megoldásnak hátránya az, hogy amennyiben egy Post-it van a beszkennelt dokumentumon, akkor ez figyelmeztetés vagy megállás nélkül beolvasásra fog kerülni. A korszerűbb dokumentumszkennerek a duplabehúzást külön optikai vagy ultrahangos szenzorral figyelik. Az ultrahangos szenzorok megbízhatóbb detektálást biztosítanak az optikai szenzorokhoz képest. Az ultrahangos szenzorok a két összetapadt dokumentum közötti levegőrést érzékelik. Amennyiben duplabehúzást érzékelnek, az operátornak lehetősége van a dokumentumokat szétszedni és újra beolvasni. Nagyobb teljesítményű szkennerekben több ultrahangos szenzor is van, amelyek egyenként akár ki- és bekapcsolhatók.

 

Keretlevágás

Amennyiben a szkenner adagolójába nem egyforma méretű dokumentumokat (A4-es papírok, tértivevények, csekkek, számlák stb.) teszünk, úgy a szkennernek gondoskodnia kell arról, hogy a beolvasott dokumentum képe is csak akkora legyen, mint amekkora a beolvasott papír fizikai mérete. Ez szintén alapvető elvárás a dokumentumszkennereknél, ellenkező esetben egy A4-es méretre beállított feldolgozás esetén a beolvasott tértivevény körül egy jókora (A4) keret keletkezne, ami hasznos információt nem tartalmaz, viszont a fájlméretet növeli. A dokumentumszkennernek a változó méretű dokumentumok képeit dinamikusan kell feldolgozni, azaz minden dokumentumot csak akkora méretben kell beolvasnia, amekkora a dokumentum maga.

 

A folyamatos fejlesztéseknek köszönhetően a legújabb dokumentumszkennerek a fentieken túlmenően már számos olyan feladatot is elvégeznek, amelyeket eddig csak opcionális kiegészítőkkel lehetett megoldani. Ezek a következők:

 

Automatikus színdetektálás

A legújabb dokumentumszkennerek használatával nem kell többé a szkenner adagolójába tett színes és fekete-fehér dokumentumokat szétválogatni. A szkennerek képesek felismerni, hogy a melyik dokumentum színes és melyik nem, majd a színes dokumentumokat automatikusan színes üzemmódban szkennelik be, míg a fekete-fehér dokumentumokat fekete-fehérben. Ezáltal jelentős időt takaríthatunk meg, hiszen nem kell a szkennelés előtt a dokumentumokat manuálisan előszortírozni, szeparátor vagy patch-kódokat tartalmazó lapokat beiktatni a kötegbe.

 

Üres oldalak intelligens felismerése

A korszerű dokumentumszkennerek képesek beazonosítani, hogy kétoldalas feldolgozás esetén a dokumentumok hátoldalán is van-e hasznos információ vagy az adott oldal teljesen üres. Amennyiben a szkenner detektálja, hogy a hátoldalon nincsen hasznos információ, úgy a hátoldal képe automatikusan törlésre kerül. Amennyiben viszont a dokumentum hátoldalán akár minimális adat is detektálható, úgy a dokumentum képének hátoldala is elmentésre kerül. Természetesen az, hogy mi minősülhet üres oldalnak és mi nem, a felhasználó által is interaktív módon szabályozható, így nem fordulhat elő, hogy egy halvány, szabad szemmel is alig látható, ám hasznos információ törlésre kerüljön.

 

Automatikus szövegirány felismerés

A korszerű dokumentumszkennerek képesek a dokumentumokon lévő információkat analizálni és amennyiben a szkenner adagolójába fektetett dokumentum kerül beolvasásra, úgy a dokumentumon lévő szöveg iránya alapján a beolvasott dokumentum képét automatikusan olvasható irányba forgatja be. A szövegirány felismerése nyelvfüggetlen, gyakorlatilag szinte minden latin karaktereket használó nyelvvel működik.

 

A dokumentumszkenner, mint a láncszem első tagja

Mint a fentiekből is látható, a korszerű dokumentumszkennerek használatával számos olyan feladat elvégezhető, amely más szkennerek esetében csak külön opcionális kiegészítőkkel érhető el. A dokumentumok előkészítésére fordított idő jelentősen lecsökkenthető azáltal, hogy a szkennerek adagolójába keverve tehetünk színes és fekete-fehér, állított és fektetett, egy- és kétoldalas dokumentumokat, hiszen a szkenner mindent felismer és automatikusan elvégzi az adott dokumentummal szükséges teendőket.

Az üzleti dokumentumok hatékony feldolgozásához egy archiváló szkenner önmagában azonban nem elegendő, ugyanis egy jó archiváló szkenner csak félig oldja meg a problémát, mindössze annyit érünk el vele, hogy a papír alapú dokumentumokat átalakítjuk elektronikus formátumra. Gondoljunk bele, ezzel a problémát alapvetően nem oldottuk meg: Eddig egy halom papírunk volt, most egy halom fájlunk lett, az információról azonban továbbra sem tudunk semmit. Az archiválás célja nem az, hogy a dokumentumokat papír helyett beszkennelt TIFF képek formájában tároljuk el, hanem az, hogy a beszkennelt dokumentumok képe bekerüljön egy feldolgozó rendszerbe, amely osztályozza és kereshető információvá konvertálja azt. Ehhez persze többnyire intelligens technológiákra van szükség, mint például a szövegfelismerés, vonalkód felismerés, jelölő mezők értelmezése stb. Az eredmény már nem képek halmaza lesz, hanem adatbázisba rendezett visszakereshető adatok, információk, amely alapján üzleti folyamatainkat hatékonyabbá, eredményesebbé és gyorsabbá tehetjük. Ebből is látható, hogy a feldolgozó szoftverek (szövegfelismerő, vonalkód felismerő, indexelő stb.) számára rendkívül fontos az, hogy a beszkennelt képen lévő adatok (szövegek, számok, vonalkódok stb.) mennyire olvashatók, ugyanis ezen szoftverek felismerési pontossága nagymértékben függ a bemeneten lévő dokumentumok képének minőségétől.

Cégünk a Fujitsu és Kodak dokumentumszkennereket forgalmazza Magyarországon, amelyek a fenti kritériumokat képesek teljesíteni és a legkisebb teljesítménytől a legnagyobbig bármilyen igényre képesek megoldást adni. Az egyes dokumentumszkennerek részletes ismertetőinek eléréséhez a gyártó logójára kattintással lehet eljutni. 

 


scrollUp