Název sekce
|
Digitální přístup k dokumentům
|
Nové trendy v digitalizaci historických dokumentů
Stanislav Psohlavec, AiP Beroun s.r.o.
Komprimace dat vytváří prostor pro efektivní poskytování kvalitního obrazu. Moderní formáty ji velmi efektivně využívají.
Rozlišení obrazu je pro kvalitní a efektivní přenos informací velmi důležité. Musí odpovídat skutečnému informačnímu obsahu.
Uvážená ztrátová komprimace v kombinaci se správně volených rozlišením přináší větší informační obsah dokumentů při
podstatně menších objemech dat. Stručně aktuální novinky na digitalizačním pracovišti v NKČR:
- barevná kalibrace systémem GretagMecbeth a práce s ICC profily
- pro významné rukopisy individuální kalibrační tabulky
- nový scanner CRUSE, mikroklimatizace, osvětlení na ateliérové úrovni, vysoká šetrnost i výkon
Úvod
Veškeré poskytování digitálního obrazu začíná rozhodnutím v jaké
kvalitě obraz vytvořit a zaznamenat. Toto rozhodování probíhá až překvapivě často jen na základě subjektivního pocit, nebo na
základě tradovaných nebo převzatých názorů. Přitom rozhodnutí, jak je potřeba pořizovat a uchovávat data, může zcela zásadně
ovlivnit náklady na projekty.
V dalších úvahách necháme stranou vliv zvoleného formátu pro uložení dat. Budeme předpokládat, že vznikající data svým obsa
hem vyhovují očekávání uživatele. Budeme sledovat jen vlivy volby rozlišení a
komprese dat na informační obsah.
Lze souhlasit s pravdivostí tvrzení:
Základní technické parametry digitálního obrazu tj. rozlišení a typ komprese
určují velikost vytvářených da t.
Praktického uživatele zajímají dosažitelné a využitelné informace a
dostane-li je, bude spokojen. Je mu zcela lhostejné z jak objemných dat své informace získá. Lze však položit rovnítko mezi
objem dat a množství informací, které skutečně obsahují?
Mys lím, že ne.
Cílem mého příspěvku je srozumitelně a přesvědčivě ukázat, že existují vlivy, které je nutno brát v úvahu
při rozhodování o efektivní volbě použitého rozlišení a komprese.
Informační obsah
Jak hodnotit množství a kvalitu zachované informace? Při posuzování hranic
možností zachování detailu ve fotografii se používají čárové testy. Frekvence čar (počet čar/mm), které filmový materiál
spolehlivě zaznamená, naznačuje hranice možnosti záznamu detailů na filmový materiál. Stejné principy platí při záznamu elektrických signálů reprezentujících zvuk. V oblasti signálové analýzy
je tato problematika velmi detailně teoreticky zvládnuta. Našla již dávno své praktické využití nejprve ve stanovení technických
norem pro digitální záznam zvuku a posléze i v celém vývoji
komprimovaného ukládání zvuku o jehož účelnosti nikdo nepochybuje. Podobné vývojové trendy zákonitě pronikají i do oblasti
zpracování obrazu.
S promyšlenou komprimací obrazových dat, s optimalizovaným a účelu přiměřeným rozlišením se setkáváme
díváme-li se na televizi, používáme-li počítač a internet. Příchod nových technologií zpracování a komprese obrazu využívá
logiku již dříve dobře zvládnutou a osvědčenou v audio technice. Základem je plnohodnotné zachování signálů nesoucích
člověku užitečnou informaci a vědomé potlačení nedůležitých resp. člověkem nevyužitelných informací.
Přesto při digitalizaci obrazu jsou někdy aplikována v souvislosti s kompresí a rozlišením obrazu
pravidla, která při formální aplikaci a hlavně vytržena ze souvislosti, mohou působit škodlivě stejně jako pověry.
Mám na mysli především stanovené limity rozlišení a stále se opakující pověra o škodlivosti ztrátové
komprese.
Trocha teorie
Existují však vůbec exaktní postupy jak stanovit pro daný objekt objektivně
potřebné rozlišení? Samozřejmě ano, nicméně prakticky je vyloučeno provádět takovýto výzkum při každé úvaze jaké rozlišení
aplikovat. Přesto zde naznačím možný postup, abych teoreticky odůvodnil následující úvahy.
Furierova transformace je matematická metoda, kter á dovoluje
analyzovat průběh libovolného signálu a převést jej na součet sinusových signálů vhodných frekvencí a amplitud. V obrazovém
‚signálu‘ pak nejvyšší nalezené frekvence odpovídají čárové frekvenci, která musí být zaznamenána.
Čím je daná tato nejvy šší frekvence?
Pro reálné předměty se blíží nekonečnu, protože při každém dalším přiblížení
nalézáme nové jemnější detaily a toto zjemňování končí na molekulární úrovni.
První omezení je technické. Při digitalizaci je rozhodujícím limitujícím prvkem počet CCD pixelů
připadajících na zobrazení jednotky délky. Nejvyšší zachytitelná čárová frekvence je více než 2x nižší než frekvence CCD
prvků.
Druhé omezení stanoví uživatel tím, že určí hranici detailů, které ho ještě zajímají. Tato hranice musí být
nižší (nejvýše stejná) než hranice technická.
Třetí omezení je dáno záznamem. Zvolené rozlišení záznamu určuje nejvyšší zaznamenatelnou frekvenci podobně
jako je určena maximální frekvence CCD prvku. Již z tohoto plyne , že nemá smyl uchovávat obraz v rozlišení vyšším než
je fyzické rozlišení snímacího zařízení. Toto zdánlivě zbytečné (protože zcela jasné) konstatování je nutné, protože
překvapivě často tato informace chybí nebo je alespoň poskytována velmi nenápadně (ploché scannery, některé kamerové scanner
y).
Pokud je předmětem digitalizace zprostředkovaný obraz (film), přibývá další
omezení. Pokud je maximální zaznamenaná frekvence vyšší než výše uvedená omezení, je vše v pořádku. Pokud je nižší, stává
se tato frekvence rozhodující. Jinak řečeno, nascanujeme-li velmi kvalitně neostrý film, chybějící informace neobnovíme.
(nevěřte neomezenému zvětšování detailu známému z mnoha detektivek).
Jinak řečeno, nejvyšší zaznamenaná frekvence je určena nejhorším členem z trojice
digitalizovaný objekt
digitalizační zařízení,
záznam.
Objektivně známe a můžeme snadno řídit jen vlastnosti záznamu. Z toho plyne
zásadní úvaha:
- Zaznamenáváme-li výsledy digitalizace s dostatečně vysokým rozlišením, je zaznamenaný informační obsah dán jen
digitalizovaným objektem a digitalizačním zařízením. Záznam jej neomezuje. Tento informační obsah se nemění ani pozdější
změnou rozlišení, pokud toto rozlišení (maximální zaznamenatelná frekvence) zůstane dostatečně vyšší než odpovídá
informačnímu obsahu záznamu.
P
okud je rozlišení záznamu nižší (blízké) než informační obsah daný digitalizovaným objektem a
digitalizačním zařízením, je maximální zaznamenatelná frekvence daná záznamem.
Výše uvedené tvrzení lze změnit na otázku:
Určují základní technické parametry digitálního obrazu tj. rozlišení a typ komprese množství uchovaných
informací? Odpověď je:Určují maximální limity, informační obsah však může být menší.
Rozlišení
Dovolte jeden ilustrativní příklad:
Na následující stránce jsou dvě trojice obrazů.
První představuje detaily z nascannované vizitky v těchto rozlišeních
A:200 DPI, B:400 DPI a C:800DPI
Rozdíl je mezi subjektivně vnímanou kvalitou je evidentní. Zdá se, že o rozdílech v
úrovni informačního obsahu netřeba diskutovat.
Ale podívejme se na násled ující trojici. Tyto tři obrazy jsou všechny v rozlišení
800DPI. Jde však o identickou trojici jako v minulém příkladu. Pouze obrazy A a B byly matematicky převzorkovány do
rozlišení obrazu C.
Je jasné, že pouhou matematickou operací nová informace v obraze nevznikne. Subjektivní vnímání
‚kvality‘ ale říká, že obrázky jsou podstatně lepší. První obrázek je sice horší, než druhý, ale druhý je prakticky
identický s třetím. Z toho lze vyvodit na základě předchozích teoretických úvah jednoznačný závěr:
Infor mační obsah obrazu nascannovaného pro 400 DPI je
identický s obrazem nascannovaným na 800DPI.
Lze tedy říci, že v informačním obsahu obrázku B a C není významný rozdíl, ač je poměr jejich velikostí
1:4.
Naopak - protože existuje zřetelný rozdíl mezi převzorkovaným obrazem A a B, je zřejmé, že informační obsah
obrazu B je vyšší než obrazu A.
Konzultací tohoto jevu s výrobcem scanneru mi bylo potvrzeno, že scanner
hardwarově poskytuje obraz v rozlišení cca 350 DPI. Tento obraz je ihned přepočítáván na rozlišení požadované uživatelem -
u tohoto scanneru až na 9600 DPI (!). Je ale zřejmé, že informační obsah bude i při tomto šíleném rozlišení stejný jako u
prvotních dat – tedy 350 DPI. Rozdíl je tedy jen v subjektivním dojmu z obrazu a pochopitelně ve veliko sti dat.
Důležité je si uvědomit, že pro úplné uchování výsledků digitalizace stačí zachovat
prvotní data. Na vyšší rozlišení lze obraz rozšířit kdykoli později dle potřeby. Mnohé zobrazovací softwary tuto konverzi
provádějí automaticky ( umí to například WORD při vkládání obrazu do textu).
Není tedy nutno uchovávat (případně přenášet) zbytečně ‚načechraná‘ data. Možnost
úspory záznamového prostoru nebo kapacit pro přenos dat je evidentní. Je vždy účelné přenést jen nutnou informaci a tu pak u
uživatel e konvertovat tak, aby byla vnímatelná lépe.
Detail obrazu nascannovaného na plochém scanneru při zadaném rozlišení
A: 200DPPI B: 400DPI C: 800 DPI
A převzorkováno bikubicky B převzorkováno bikubicky
na 800DPI na 800DPI 800DPI
S těmito obrazy lze udělat ještě jeden pokus. Jestliže obraz C (800 DPI) převzor kujeme
na 400 a 200DPI a pak tyto
obrazy převedeme zase zpět na rozlišení 800 DPI, uvidíme které snížení rozlišení
přineslo ztrátu informace.
Tím zjistíme kde leží úroveň využitelných informací v obraze. Výsledky pokusu jsou identické s dříve
uvedeným. Lze z nich zhruba vyvodit, že chceme-li zachovat informační obsah obrazu, stačí jej ukládat v rozlišení
zhruba 400 DPI.
Uvedu ještě jiný příklad.
Na mikrofilmu je již informační obsah ovlivněn vlastnostmi media. Po digitalizaci mikrofilmu tedy informační
obsah odpovídá možnostem filmu a digitalizace. Vím, že scanner SunRise dovoluje velmi dobře využít plného rozlišení CD
prvku. Informační obsah tedy bude dán takřka výhradně vlastnostmi scannovaného filmu, nikoli vlastnostmi zařízení. Jde o
obrácenou sit uaci než v předchozím příkladě, kdy kvalita originálu
(jeho informační obsah) výrazně přesahovala možností zařízení.
Původní obraz je poslední vpravo a odpovídá rozlišení originálu cca 400 DPI. Tento obraz byl převzorkován na
100,150…350 DPI a pak převzorkován zpět na 400DPI. Pokud jsou v obraze informace vyžadující vyšší rozlišení než je
použito v mezikroku, obraz se znatelně zhorší, protože tyto informace nebylo možné uchovat a při návratu do vyššího
rozlišení se neobnovily, byly tedy odstraněny.
100 DPI 150 DPI 200 DPI 250 DPI 300 DPI 400 DPI
Série pohledů dokumentuje, že ke znatelnému zhoršení informačního obsahu dochází až
při poklesu rozlišení pod 200 DPI, tedy pro obraz 4x menší než maximální.
Film tedy obsahuje tolik informací, že pro jejich zachování je nutné použít rozhodně více než 150 DPI. Dobré
je již rozlišení 200 DPI (s rezervou pro jistotu nejvýše 250-300DPI).
Závěr:
Inf ormační obsah digitalizovaného objektu a vlastnosti
digitalizačního zařízení určují účelné rozlišení, které minimálně má být pro uchování digitální informace použito.
Použití nižšího rozlišení znamená ztrátu již vzniklé informace.
Použití vyššího rozlišení znamená neúčelný nárůst objemu dat, protože informační obsah se nemění.
Hranice samozřejmě není ostrá, nutno pracovat s jistou rezervou, nicméně s vědomím, že nárůst
objemu dat je vzhledem k rozlišení kvadratický a může být zbytečný.
Samotný údaj o rozl išení obrazu neposkytuje informaci o
skutečném informačním obsahu digitálního obrazu, sděluje jen nejvyšší úroveň, které může být dosaženo.
Ztrátová komprese
Občasné odmítání ztrátové komprese jistě souvisí se slůvkem ‚ztrátová‘ , které
vzbuzuje obavy a nedůvěru.
Porovnejme vliv ztrátové komprese která vede ke zmenšení souborů na 1/3, 1/10 a mírného zaostření obrazu.
Uložení obrazu v JPG, Photoshop 5.0.
Nejvyšší kvalita (10), komprese 3x Střední kvalita (5), komprese 11x Zaostře ní
Následující obrazy vznikly odečtením obrazu od originálního, vyjadřují tedy
“deformaci” těchto obrázků.
Pro názornost je tento obraz upraven zvýrazněným zvýšením jasu (+100) a kontrastu (+40).
Obraz identický s originálem by poskytl šedou plochu.
Odpovídající histogramy ukazují jak se změnil původní obraz kompresí nebo
zaostřením.
Nej větší změny přineslo, jak je vidět, zaostření obrazu.
Funkce zostření i jiných úprav bývají implementovány již do procesu prvotního pořizování dat. Přitom jejich
vliv na změnu informačního obsahu je, jak je vidět,větší případně srovnatelný se změnami ze z trátové
komprese.
Uložení obrazu v JPG nejvyšší kvalitě přineslo v podstatě jen odchylky nejvýše
+/- 2 bit (při bližší prohlídce zjistíme, že především v blízkosti hran). To odpovídá základním variacím, které lze zjistit
například v nascannované homogenní (například kalibrační) šedé ploše. Pro reálný papír nebo pergamen se tyto odchylky na
homogenní ploše pohybují do +/- 5. Jevy způsobené kompresí jsou tedy bezpečně maskovány přirozenými vlastnostmi předlohy.
Při uložení dat v JPG při vyšší kompresi již může zkušené oko rozpoznat vznikající efekty, ty však
nevedou ke ztrátě informace, která je nesena především hranami a liniemi v obrazu. Teprve vysoká komprese znatelně degraduje
hrany a efekty jsou dobře viditelné, ostrost klesá.
Vysoká komprese však můž e být kompenzována vyšším rozlišením.
Následující obrazy pocházejí ze dvou přibližně stejně velkých (cca 65 kB) souborů.
Posuďte sami subjektivně úroveň informačního obsahu.
JPG, 40 DPI, vysoce ztrátová komprese (2) TIF, 10 DPI (bezeztrátové u ložení)
Kalibrace
Požadavky na kalibraci ještě dále komplikují otázku co je tím správným,
digitálním obrazem, který má být archivován. Obecně lze říci, že rozdíly mezi kalibrovaným a nekalibrovaným obrazem jsou obvykle
číselně výrazně větší než výše naznačené změny způsobené ztrátovou kompresí. Přitom poskytování obrazů v definovaném ICC
profilu v oblasti digitalizace pro archivaci je stále spíše výjimkou.
Shrnutí
Ztrátová komprimace dat při komunikaci po Internetu je samozřejmostí.
Přicházejí nové technologie zpřístupňování dat, které dále zvyšují účinnost komprimace plným využíváním daného datového prostoru
pouze pro uchování/přenos člověkem využitelných informac í.
Prvním článkem tohoto řetězu však vždy zůstane pořizování dat. Proto již v tomto
kroku je třeba zvažovat nejen vlastnosti vznikajících dat z hlediska požadavků uživatele, ale i z hlediska správnosti a
efektivity jejich uložení.
Ukázka optimálního obra zu digitalizované mapy pořízeného scannovací kamerou
CRUSE SL 285.
|