INFORUM 2001 - příspěvek na konferenci

Název sekce

Digitální přístup k dokumentům

Nové trendy v digitalizaci historických dokumentů

Stanislav Psohlavec, AiP Beroun s.r.o.

Komprimace dat vytváří prostor pro efektivní poskytování kvalitního obrazu. Moderní formáty ji velmi efektivně využívají. Rozlišení obrazu je pro kvalitní a efektivní přenos informací velmi důležité. Musí odpovídat skutečnému informačnímu obsahu. Uvážená ztrátová komprimace v kombinaci se správně volených rozlišením přináší větší informační obsah dokumentů při podstatně menších objemech dat.
Stručně aktuální novinky na digitalizačním pracovišti v NKČR:

barevná kalibrace systémem GretagMecbeth a práce s ICC profily
pro významné rukopisy individuální kalibrační tabulky
nový scanner CRUSE, mikroklimatizace, osvětlení na ateliérové úrovni, vysoká šetrnost i výkon

Úvod

Veškeré poskytování digitálního obrazu začíná rozhodnutím v jaké kvalitě obraz vytvořit a zaznamenat. Toto rozhodování probíhá až překvapivě často jen na základě subjektivního pocit, nebo na základě tradovaných nebo převzatých názorů. Přitom rozhodnutí, jak je potřeba pořizovat a uchovávat data, může zcela zásadně ovlivnit náklady na projekty.
V dalších úvahách necháme stranou vliv zvoleného formátu pro uložení dat. Budeme předpokládat, že vznikající data svým obsa hem vyhovují očekávání uživatele. Budeme sledovat jen vlivy volby rozlišení a komprese dat na informační obsah.

Lze souhlasit s pravdivostí tvrzení:

Základní technické parametry digitálního obrazu tj. rozlišení a typ komprese určují velikost vytvářených dat.

Praktického uživatele zajímají dosažitelné a využitelné informace a dostane-li je, bude spokojen. Je mu zcela lhostejné z jak objemných dat své informace získá. Lze však položit rovnítko mezi objem dat a množství informací, které skutečně obsahují?

Myslím, že ne.

Cílem mého příspěvku je srozumitelně a přesvědčivě ukázat, že existují vlivy, které je nutno brát v úvahu při rozhodování o efektivní volbě použitého rozlišení a komprese.

Informační obsah

Jak hodnotit množství a kvalitu zachované informace? Při posuzování hranic možností zachování detailu ve fotografii se používají čárové testy. Frekvence čar (počet čar/mm), které filmový materiál spolehlivě zaznamená, naznačuje hranice možnosti záznamu detailů na filmový materiál. Stejné principy platí přizáznamu elektrických signálů reprezentujících zvuk. V oblasti signálové analýzy je tato problematika velmi detailně teoreticky zvládnuta. Našla již dávno své praktické využití nejprve ve stanovení technických norem pro digitální záznam zvuku a posléze i v celém vývoji komprimovaného ukládání zvuku o jehož účelnosti nikdo nepochybuje. Podobné vývojové trendy zákonitě pronikají i do oblasti zpracování obrazu.

S promyšlenou komprimací obrazových dat, s optimalizovaným a účelu přiměřeným rozlišením se setkáváme díváme-li se na televizi, používáme-li počítač a internet. Příchod nových technologií zpracování a komprese obrazu využívá logiku již dříve dobře zvládnutou a osvědčenou v audio technice. Základem je plnohodnotné zachování signálů nesoucích člověku užitečnou informaci a vědomé potlačení nedůležitých resp. člověkem nevyužitelných informací.

Přesto při digitalizaci obrazu jsou někdy aplikována v souvislosti s kompresí a rozlišením obrazu pravidla, která při formální aplikaci a hlavně vytržena ze souvislosti, mohou působit škodlivě stejně jako pověry.

Mám na mysli především stanovené limity rozlišení a stále se opakující pověra o škodlivosti ztrátové komprese.

Trocha teorie

Existují však vůbec exaktní postupy jak stanovit pro daný objekt objektivně potřebné rozlišení? Samozřejmě ano, nicméně prakticky je vyloučeno provádět takovýto výzkum při každé úvaze jaké rozlišení aplikovat. Přesto zde naznačím možný postup, abych teoreticky odůvodnil následující úvahy.

Furierova transformace je matematická metoda, která dovoluje analyzovat průběh libovolného signálu a převést jej na součet sinusových signálů vhodných frekvencí a amplitud. V obrazovém ‚signálu‘ pak nejvyšší nalezené frekvence odpovídají čárové frekvenci, která musí být zaznamenána.

Čím je daná tato nejvyšší frekvence?

Pro reálné předměty se blíží nekonečnu, protože při každém dalším přiblížení nalézáme nové jemnější detaily a toto zjemňování končí na molekulární úrovni.

První omezení je technické. Při digitalizaci je rozhodujícím limitujícím prvkem počet CCD pixelů připadajících na zobrazení jednotky délky. Nejvyšší zachytitelná čárová frekvence je více než 2x nižší než frekvence CCD prvků.

Druhé omezení stanoví uživatel tím, že určí hranici detailů, které ho ještě zajímají. Tato hranice musí být nižší (nejvýše stejná) než hranice technická.

Třetí omezení je dáno záznamem. Zvolené rozlišení záznamu určuje nejvyšší zaznamenatelnou frekvenci podobně jako je určena maximální frekvence CCD prvku. Již z tohoto plyne , že nemá smyl uchovávat obraz v rozlišení vyšším než je fyzické rozlišení snímacího zařízení. Toto zdánlivě zbytečné (protože zcela jasné) konstatování je nutné, protože překvapivě často tato informace chybí nebo je alespoň poskytována velmi nenápadně (ploché scannery, některé kamerové scanner y).

Pokud je předmětem digitalizace zprostředkovaný obraz (film), přibývá další omezení. Pokud je maximální zaznamenaná frekvence vyšší než výše uvedená omezení, je vše v pořádku. Pokud je nižší, stává se tato frekvence rozhodující. Jinak řečeno, nascanujeme-li velmi kvalitně neostrý film, chybějící informace neobnovíme.

(nevěřte neomezenému zvětšování detailu známému z mnoha detektivek).

Jinak řečeno, nejvyšší zaznamenaná frekvence je určena nejhorším členem z trojice
digitalizovaný objekt

digitalizační zařízení,

záznam.

Objektivně známe a můžeme snadno řídit jen vlastnosti záznamu. Z toho plyne zásadní úvaha:

Zaznamenáváme-li výsledy digitalizace s dostatečně vysokým rozlišením, je zaznamenaný informační obsah dán jen digitalizovaným objektem a digitalizačním zařízením. Záznam jej neomezuje. Tento informační obsah se nemění ani pozdější změnou rozlišení, pokud toto rozlišení (maximální zaznamenatelná frekvence) zůstane dostatečně vyšší než odpovídá informačnímu obsahu záznamu.

P okud je rozlišení záznamu nižší (blízké) než informační obsah daný digitalizovaným objektem a digitalizačním zařízením, je maximální zaznamenatelná frekvence daná záznamem.

Výše uvedené tvrzení lze změnit na otázku:

Určují základní technické parametry digitálního obrazu tj. rozlišení a typ komprese množství uchovaných informací? Odpověď je:Určují maximální limity, informační obsah však může být menší.
Rozlišení

Dovolte jeden ilustrativní příklad:

Na následující stránce jsou dvě trojice obrazů.

První představuje detaily z nascannované vizitky v těchto rozlišeních

A:200 DPI, B:400 DPI a C:800DPI

Rozdíl je mezi subjektivně vnímanou kvalitou je evidentní. Zdá se, že o rozdílech v úrovni informačního obsahu netřeba diskutovat.

Ale podívejme se na následující trojici. Tyto tři obrazy jsou všechny v rozlišení 800DPI. Jde však o identickou trojici jako v minulém příkladu. Pouze obrazy A a B byly matematicky převzorkovány do rozlišení obrazu C.

Je jasné, že pouhou matematickou operací nová informace v obraze nevznikne. Subjektivní vnímání ‚kvality‘ ale říká, že obrázky jsou podstatně lepší. První obrázek je sice horší, než druhý, ale druhý je prakticky identický s třetím. Z toho lze vyvodit na základě předchozích teoretických úvah jednoznačný závěr:

Informační obsah obrazu nascannovaného pro 400 DPI je identický s obrazem nascannovaným na 800DPI.

Lze tedy říci, že v informačním obsahu obrázku B a C není významný rozdíl, ač je poměr jejich velikostí 1:4.

Naopak - protože existuje zřetelný rozdíl mezi převzorkovaným obrazem A a B, je zřejmé, že informační obsah obrazu B je vyšší než obrazu A.

Konzultací tohoto jevu s výrobcem scanneru mi bylo potvrzeno, že scanner hardwarově poskytuje obraz v rozlišení cca 350 DPI. Tento obraz je ihned přepočítáván na rozlišení požadované uživatelem - u tohoto scanneru až na 9600 DPI (!). Je ale zřejmé, že informační obsah bude i při tomto šíleném rozlišení stejný jako u prvotních dat – tedy 350 DPI. Rozdíl je tedy jen v subjektivním dojmu z obrazu a pochopitelně ve velikosti dat.

Důležité je si uvědomit, že pro úplné uchování výsledků digitalizace stačí zachovat prvotní data. Na vyšší rozlišení lze obraz rozšířit kdykoli později dle potřeby. Mnohé zobrazovací softwary tuto konverzi provádějí automaticky ( umí to například WORD při vkládání obrazu do textu).

Není tedy nutno uchovávat (případně přenášet) zbytečně ‚načechraná‘ data. Možnost úspory záznamového prostoru nebo kapacit pro přenos dat je evidentní. Je vždy účelné přenést jen nutnou informaci a tu pak u uživatele konvertovat tak, aby byla vnímatelná lépe.

Detail obrazu nascannovaného na plochém scanneru při zadaném rozlišení

A: 200DPPI B: 400DPI C: 800 DPI

A převzorkováno bikubicky B převzorkováno bikubicky

na 800DPI na 800DPI 800DPI

S těmito obrazy lze udělat ještě jeden pokus. Jestliže obraz C (800 DPI) převzorkujeme na 400 a 200DPI a pak tyto

obrazy převedeme zase zpět na rozlišení 800 DPI, uvidíme které snížení rozlišení přineslo ztrátu informace.

Tím zjistíme kde leží úroveň využitelných informací v obraze. Výsledky pokusu jsou identické s dříve uvedeným. Lze z nich zhruba vyvodit, že chceme-li zachovat informační obsah obrazu, stačí jej ukládat v rozlišení zhruba 400 DPI.

Uvedu ještě jiný příklad.

Na mikrofilmu je již informační obsah ovlivněn vlastnostmi media. Po digitalizaci mikrofilmu tedy informační obsah odpovídá možnostem filmu a digitalizace. Vím, že scanner SunRise dovoluje velmi dobře využít plného rozlišení CD prvku. Informační obsah tedy bude dán takřka výhradně vlastnostmi scannovaného filmu, nikoli vlastnostmi zařízení. Jde o obrácenou situaci než v předchozím příkladě, kdy kvalita originálu (jeho informační obsah) výrazně přesahovala možností zařízení.

Původní obraz je poslední vpravo a odpovídá rozlišení originálu cca 400 DPI. Tento obraz byl převzorkován na 100,150…350 DPI a pak převzorkován zpět na 400DPI. Pokud jsou v obraze informace vyžadující vyšší rozlišení než je použito v mezikroku, obraz se znatelně zhorší, protože tyto informace nebylo možné uchovat a při návratu do vyššího rozlišení se neobnovily, byly tedy odstraněny.

100 DPI 150 DPI 200 DPI 250 DPI 300 DPI 400 DPI

Série pohledů dokumentuje, že ke znatelnému zhoršení informačního obsahu dochází až při poklesu rozlišení pod 200 DPI, tedy pro obraz 4x menší než maximální.

Film tedy obsahuje tolik informací, že pro jejich zachování je nutné použít rozhodně více než 150 DPI. Dobré je již rozlišení 200 DPI (s rezervou pro jistotu nejvýše 250-300DPI).

Závěr:

Informační obsah digitalizovaného objektu a vlastnosti digitalizačního zařízení určují účelné rozlišení, které minimálně má být pro uchování digitální informace použito.

Použití nižšího rozlišení znamená ztrátu již vzniklé informace.

Použití vyššího rozlišení znamená neúčelný nárůst objemu dat, protože informační obsah se nemění.

Hranice samozřejmě není ostrá, nutno pracovat s jistou rezervou, nicméně s vědomím, že nárůst objemu dat je vzhledem k rozlišení kvadratický a může být zbytečný.

Samotný údaj o rozlišení obrazu neposkytuje informaci o skutečném informačním obsahu digitálního obrazu, sděluje jen nejvyšší úroveň, které může být dosaženo.

Ztrátová komprese

Občasné odmítání ztrátové komprese jistě souvisí se slůvkem ‚ztrátová‘ , které vzbuzuje obavy a nedůvěru.

Porovnejme vliv ztrátové komprese která vede ke zmenšení souborů na 1/3, 1/10 a mírného zaostření obrazu.

Uložení obrazu v JPG, Photoshop 5.0.

Nejvyšší kvalita (10), komprese 3x Střední kvalita (5), komprese 11x Zaostření

Následující obrazy vznikly odečtením obrazu od originálního, vyjadřují tedy “deformaci” těchto obrázků.

Pro názornost je tento obraz upraven zvýrazněným zvýšením jasu (+100) a kontrastu (+40).
Obraz identický s originálem by poskytl šedou plochu.

Odpovídající histogramy ukazují jak se změnil původní obraz kompresí nebo zaostřením.

Největší změny přineslo, jak je vidět, zaostření obrazu.

Funkce zostření i jiných úprav bývají implementovány již do procesu prvotního pořizování dat. Přitom jejich vliv na změnu informačního obsahu je, jak je vidět,větší případně srovnatelný se změnami ze ztrátové komprese.

Uložení obrazu v JPG nejvyšší kvalitě přineslo v podstatě jen odchylky nejvýše +/- 2 bit (při bližší prohlídce zjistíme, že především v blízkosti hran). To odpovídá základním variacím, které lze zjistit například v nascannované homogenní (například kalibrační) šedé ploše. Pro reálný papír nebo pergamen se tyto odchylky na homogenní ploše pohybují do +/- 5. Jevy způsobené kompresí jsou tedy bezpečně maskovány přirozenými vlastnostmi předlohy.

Při uložení dat v JPG při vyšší kompresi již může zkušené oko rozpoznat vznikající efekty, ty však nevedou ke ztrátě informace, která je nesena především hranami a liniemi v obrazu. Teprve vysoká komprese znatelně degraduje hrany a efekty jsou dobře viditelné, ostrost klesá.

Vysoká komprese však může být kompenzována vyšším rozlišením.

Následující obrazy pocházejí ze dvou přibližně stejně velkých (cca 65 kB) souborů.

Posuďte sami subjektivně úroveň informačního obsahu.

JPG, 40 DPI, vysoce ztrátová komprese (2) TIF, 10 DPI (bezeztrátové uložení)

Kalibrace

Požadavky na kalibraci ještě dále komplikují otázku co je tím správným, digitálním obrazem, který má být archivován. Obecně lze říci, že rozdíly mezi kalibrovaným a nekalibrovaným obrazem jsou obvykle číselně výrazně větší než výše naznačené změny způsobené ztrátovou kompresí. Přitom poskytování obrazů v definovaném ICC profilu v oblasti digitalizace pro archivaci je stále spíše výjimkou.

Shrnutí

Ztrátová komprimace dat při komunikaci po Internetu je samozřejmostí. Přicházejí nové technologie zpřístupňování dat, které dále zvyšují účinnost komprimace plným využíváním daného datového prostoru pouze pro uchování/přenos člověkem využitelných informací.

Prvním článkem tohoto řetězu však vždy zůstane pořizování dat. Proto již v tomto kroku je třeba zvažovat nejen vlastnosti vznikajících dat z hlediska požadavků uživatele, ale i z hlediska správnosti a efektivity jejich uložení.

Ukázka optimálního obrazu digitalizované mapy pořízeného scannovací kamerou CRUSE SL 285.