Bajkó Csaba
Bajkó Csaba
Üzletágvezető
csaba.bajko@terc.hu
06 (1) 422-25-25
06 (70) 670-52-00
Dobos Róbert
Dobos Róbert
Rendszermérnök
robert.dobos@terc.hu
06 (1) 422-25-22
06 (70) 670-51-97

Könyvszkennerek

Könyvszkennerek

Számos alkalommal kérdezik a felhasználók, hogy mi a különbség a bevásárlóközpontokban kapható SoHo (otthoni kategóriájú) síkágyas szkennerek és a könyvszkennerek között, hiszen bármely síkágyas szkennerrel is lehet könyvet szkennelni. Ez a kérdés azért is fontos, mert nem mindegy, hogy valódi könyvszkennerről beszélünk, vagy olyan szkennerről, ami ugyan otthoni felhasználásra készült, de lehet vele könyveket is szkennelni. A két dolog nem összekeverendő, hiszen nagymértékben különbözik egymástól.

Ügyfeleink számára az egyértelműbb pozícionálás és könnyebb érthetőség céljából készítettük az alábbi ismertetőt, amiben megpróbáljuk összefoglalni azokat a fontosabb ismérveket, ami a könyvszkennereket leginkább jellemzi. Reméljük, hogy az alábbi ismertetővel segítünk Ügyfeleinknek az archiválási feladatokhoz a legoptimálisabb szkennereket kiválasztani.

Mitől könyvszkenner a könyvszkenner?

A könyvszkennerek elsődlegesen kötött, vagy gyűrűs könyvek, muzeális értékű dokumentumok feldolgozására, archiválására szolgálnak, melyek speciális követelményeket támasztanak a szkennerrel szemben.

A könyvszkennerek külön kategóriát képeznek a szkennerek nagy csoportjában (személyi, kiadványszerkesztő, film, nagyformátumú, dokumentum, stb.), így mint minden más kategória, ez is dedikáltan egy speciális feladatra van felkészítve, nevezetesen a könyvek minél hatékonyabb feldolgozására, azok állagának maximális megőrzése mellett.

A könyvszkennereknek hármas funkciót kell ellátni, melyek az alábbiak:

  • A könyvekben lévő tartalom minél hatékonyabb kinyerése és elektronikusan kereshetővé tétele, a könyvek digitális változatainak integrációja a könyvtári információs rendszerekbe.
  • A könyveknek az eredetivel megegyező digitális reprodukálása, archiválása.
  • A könyvek állagának megőrzése, sérülésmentes kezelés a teljes feldolgozási folyamat során.

A könyvszkennereknek nemcsak a lapok képét kell minél élethűbben visszaadni, hanem a szöveges oldalakról a tartalmat is ki kell olvasni - szemben a többi típussal, ahol a nagy felbontás, a film adapter, a családi fotókat rendezgető szoftver a fontos. Az adatok kinyerése azért rendkívül fontos, mert a könyveknek nem elegendő pusztán „lefényképezni” a lapjait (hiszen azzal csak rengeteg képet állítanánk elő, de a képekben nem lehetne adatokat keresni), hanem a lapok tartalmát szövegfelismerő rendszerrel mind hatékonyabban kinyerni.  Adatokat, szöveges tartalmakat keresni csak a teljes feldolgozás után lehet, erre a könyvoldalak képei nem elegendőek. Kulcsfontosságú tehát, hogy az adott könyvben található információ mind hatékonyabban, minél nagyobb százalékban legyen feldolgozható, értékelhető.

Az információ az, ami bekerül az indexelő adatbázisba, a karakterfelismerő rendszerbe, a feldolgozás folyamatába, az információ az, ami üzleti értéket képvisel, ha szükség esetén a kutatóknak, látogatóknak, vagy könyvtárosoknak azonnal rendelkezésére áll. Természetesen a kép is része az archívumnak, tehát a könyvszkennereknek a képminőség terén is kimagaslót kell produkálni, de a szövegfelismerés oldaláról nézve nem a szöveg színe, hanem annak tartalma fontos, így tehát a reprodukálásnak inkább az archívum szempontjából van jelentősége.

Fizikai kezelés

A könyvszkennerek könyvbölcsővel rendelkeznek, amibe a feldolgozandó könyvet helyezzük. A könyvbölcső lehet manuális, vagy motorosan állítható, de az egyik legfontosabb célja a könyv megtartásán kívül, annak állagának megőrzése a teljes digitalizálás során. A könyvbölcsőkben a könyvgerincnek külön hely van kialakítva, hogy a lapozás során a kötés biztonságban legyen. Nem ritka, hogy a szkenner könyvhimbával rendelkezik, amivel a vízszintesen kinyitott könyv bal-és jobboldalának magasságát motorosan lehet állítani, hogy az éppen kinyitott két lap a digitalizálás ideje alatt egy magasságban és síkban legyen.

Az automatikusan lapozó robotszkennerek könyvbölcsői V alakúak, a lapozást robotkar végzi, itt is rendkívül fontos, hogy a lapozás során a kar egyszerre csak egy lapot lapozzon és azt is úgy, hogy a könyvben véletlenül se történhessen fizikai károsodás. A robotizált könyvszkennerekkel lehet a legnagyobb termelékenységet elérni, például a KIRTAS KABIS III óránként akár 3.000 lapot is képes digitalizálni. 

Beviteli felbontás

Az otthoni felhasználásra, vagy színes fotók szkennelésére gyártott szkennerek esetében fontos a nagy felbontás, ezért ezeknél a szkennereknél nem ritka a több ezer dpi felbontás. A könyvszkennerek esetében azonban figyelemmel kell lennünk arra a tényre, hogy a felbontás növelésével a fájlméret is növekszik, méghozzá négyzetes mértékben. Figyelembe kell vennünk azt a tényt, hogy míg egy fotó szkennerrel átlagosan napi maximum 40-50 fényképet lehet beszkennelni (ez már csúcsterhelés e szkennerek esetében), addig a könyvszkennereknek naponta akár több száz, vagy több ezer lapot kell beolvasni, esetenként ezeket a fájlokat interneten, vagy belső hálózaton keresztül továbbítani. Magától érthetően, ha napi több ezer dokumentumot próbálnánk több száz, vagy több ezer dpi felbontással beszkennelni és hálózaton vagy interneten keresztül továbbítani, akkor ez az indokolatlanul nagy fájlméretek miatt rendszer drasztikus lassulásához, esetenként teljes leállásához vezetne. A könyvekből kinyerhető adatok szempontjából a magasabb felbontással való szkennelés semmiféle többletinformációval nem jár, ezért nem a maximális, hanem az optimális felbontást kell megtalálni, ami az egész rendszer megbízható, azaz pontos adatokkal feltöltött és hatékony, gyors működését jelenti. A fentiek alapján érthető, hogy a könyvszkennerekben leggyakrabban alkalmazott felbontás max 200-300 dpi, ennél nagyobb felbontásra ritka esetben van szükség.

Küszöbszint (Threshold)

Jóllehet a legtöbb könyvszkenner ma már színes, a gyakorlatban azonban a nagytömegű feldolgozás sokszor 1 bites, fekete-fehér üzemmódban történik. Amikor egy könyvet fekete-fehér üzemmódban olvasunk be, a szkennernek a könyv lapjainak minden egyes képpontjáról el kell döntenie, hogy azt fekete, vagy fehér képponttá alakítsa át. Ennek eldöntéséhez a küszöbszintet (Threshold) használják, amelyen átbillenve a képpont bizonyos mértékű sötétségi fok felett fekete, míg bizonyos világossági fok alatt pedig fehér lesz. A könyvszkennerek erre külön beépített technológiát tartalmaznak, hiszen az 1 bites fekete-fehér üzemmódban beolvasott képből is ugyanúgy ki kell nyerni minden információt, mintha az szürkeskálás üzemmódban lett volna beszkennelve. Optimális esetben ezeket a technológiákat a szkennerek beépítve tartalmazzák és nem külön szoftverek segítségével érik el ugyanazt az eredményt.

Kivételkezelés

Léteznek olyan könyvek, amik kihajtható melléklettel rendelkeznek, ezért robotszkennerrel a melléklet méretei miatt nem feldolgozhatók. Az ilyen esetekben síkágyas könyvszkennerre van szükség, hiszen ezek a mellékletek csak manuálisan feldolgozhatók. A síkágyas könyvszkennerek síkágyáról beolvasott képek ugyanolyan feldolgozáson mennek keresztül (küszöbszint meghatározás, kiegyenesítés, forgatás, vágás, stb.), mintha azt a robotszkennerrel szkenneltük volna be. Fontos kiemelni, hogy a síkágyas beolvasás sebessége ebben az esetben sem összehasonlítható egy otthoni felhasználásra, vagy fotók szkennelésére szánt síkágyas szkenner sebességével, ugyanis egy A4-es oldalt mindössze 1-2 másodperc alatt képesek ezek a szkennerek beolvasni anélkül, hogy szükség lenne, előnézeti képekre, vagy bármilyen más előzetes műveletre. Kulcsfontosságú, hogy amennyiben egy könyvet robotszkennerrel, míg a kihajtható mellékleteket pedig síkágyas könyvszkennerrel olvastuk be, úgy a mellékletek képei a könyv digitális változatában is ugyanoda, arra az oldalra kerüljenek, mint ahogy a könyv eredeti állapotában is található.  
 

Keretlevágás

Amennyiben a szkenner bölcsőjébe nem szabványos méretű könyveket (A4-es, A3-as, stb) teszünk, úgy a szkennernek gondoskodnia kell arról, hogy a beolvasott dokumentum képe is csak akkora legyen, mint amekkora a beolvasott papír fizikai mérete. Ez szintén alapvető elvárás a könyvszkennereknél, ellenkező esetben egy A4-es méretre beállított feldolgozás esetén egy beolvasott A5 méretű könyv digitalizált lapjai körül egy jókora (A4) keret keletkezne, ami hasznos információt nem tartalmaz, viszont a fájlméretet növeli. A könyvszkennernek minden dokumentumot csak akkora méretben kell beolvasnia, amekkora a dokumentum maga.

Fej vagy írás??

A síkágyas könyvszkennerek esetében fontos, hogy a kinyitott könyv az írásos oldalával felfelé helyezkedjen el a könyvbölcsőben, mert ha egy üveglapra az írással lefelé helyeznénk el azt és a szkenner olvasófeje alulról digitalizálná a lapokat, akkor az egész könyvet minden egyes lap lapozásánál kézbe kellene venni, majd lapozás után visszarakni az üveglapra. Ez számos problémát vetne fel, hiszen a könyv állagának megőrzése szempontjából is fontos, hogy a könyvvel a felhasználó csak a minimális mértékben érintkezzen fizikailag. Ha a könyvet minden lapozásnál fizikailag kézbe kellene venni, akkor ez a könyv állagát is rontaná, valamint nem biztos, hogy a könyvet az üveglapon pontosan ugyanoda tudnánk minden lapozás után helyezni, így ha a szkenner nem ismerné fel automatikusan a könyv méretét és pozícióját, akkor még ezek szoftveres korrekciójára is egy csomó idő elmenne.

Könyvhajlat korrekció

A kinyitott könyvek lapjai középen ívesek, ezért a rajtuk lévő szöveg sem egyenes, hanem a hajlat görbületét követi, ami a szövegfelismerés, feldolgozás, valamint a vizuális megjelenítés szempontjából is zavaró. Ezért a korszerű könyvszkennerek ezt a könyvhajlatot digitálisan kiegyenesítik, ezt hívják könyvhajlat korrekciónak.

Megvilágítás

Állagmegóvás szempontjából a feldolgozás során nagyon fontos, hogy a könyveket egyáltalán ne, vagy csak nagyon minimális mértékben érje megvilágítás. A legoptimálisabb az, ha a szkenner egyáltalán nem világítja meg a könyvet a beolvasás alatt, hanem a környezeti fényforrás (pld ablakon bejövő fény) felhasználásával digitalizálja a könyveket. Amennyiben a könyvek megvilágítása nem elkerülhető, úgy a világításnak UV és IR mentesnek kell lenni, hogy a digitalizálandó anyagokban ne okozzon károsodást.  

A könyvszkenner, mint a láncszem első tagja

Mint a fentiekből is látható, a korszerű könyvszkennerek használatával számos olyan feladat elvégezhető, ami más szkennerek esetében nem, vagy csak rendkívül időigényes módon érhető el.

A könyvek és más dokumentumok hatékony feldolgozásához egy szkenner önmagában azonban nem elegendő, ugyanis egy jó szkenner csak félig oldja meg a problémát, mindössze annyit érünk el vele, hogy a könyveket papír alapú állapotról átalakítjuk elektronikus formátumra. Gondoljunk bele, ezzel a problémát alapvetően nem oldottuk meg: Eddig egy halom papírunk volt, most egy halom fájlunk lett, az információról azonban továbbra sem tudunk semmit. Az archiválás célja nem az, hogy a könyveket papír helyett beszkennelt TIFF képek formájában tároljuk el, hanem az, hogy a beszkennelt könyvek képe bekerüljön egy feldolgozó rendszerbe, mely osztályozza, és kereshető információvá konvertálja azt, meta adatokat kinyeri, stb.

 

 

Ehhez persze többnyire intelligens technológiákra van szükség, mint például a szövegfelismerés, vonalkód felismerés, a könyvtári információs rendszerrel való együttműködés, stb. Az eredmény már nem képek halmaza lesz, hanem adatbázisba rendezett visszakereshető adatok, e-könyvek, stb. lesznek. A feldolgozott könyvekből bármikor reprint példányok készíthetők, a könyvtárközi kölcsönzés is egyszerűbbé és gyorsabbá válik, miközben az eredeti példányt eltehetjük hosszabb távú megőrzés céljából. A digitalizálást követően a látogatók és kutatók már nem az eredeti példányt fogják használni, hanem a reprint, vagy az elektronikus változatot, aminek eredményeképp a savmentesítésre is kevesebb összegeket kell fordítani.

Az i2S és Kirtas könyvszkennereket a TERC Kft forgalmazza Magyarországon, melyek a fenti kritériumokat képesek teljesíteni és a legkisebb teljesítménytől a legnagyobbig bármilyen igényre képesek megoldást adni.

Cégünk bemutatótermében a robotizált KIRTAS KABIS és az i2S DigiBook könyvszkennerek előzetes időpont egyeztetés után megtekinthetők, kipróbálhatók.


scrollUp