Logo INFORUM 2001 - zp�t na home
O konferenci
Program
Sponzo�i
V�stava
Ceny Inforum
FotoForum
Anketa
V�bor konference
Arch�v - p�edchoz� ro�n�ky

N�zev sekce

Digit�ln� p��stup k dokument�m

Nov� trendy v digitalizaci historick�ch dokument�

Stanislav Psohlavec, AiP Beroun s.r.o.

Komprimace dat vytv��� prostor pro efektivn� poskytov�n� kvalitn�ho obrazu. Modern� form�ty ji velmi efektivn� vyu��vaj�. Rozli�en� obrazu je pro kvalitn� a efektivn� p�enos informac� velmi d�le�it�. Mus� odpov�dat skute�n�mu informa�n�mu obsahu. Uv�en� ztr�tov� komprimace v kombinaci se spr�vn� volen�ch rozli�en�m p�in�� v�t�� informa�n� obsah dokument� p�i podstatn� men��ch objemech dat.
Stru�n� aktu�ln� novinky na digitaliza�n�m pracovi�ti v NK�R:

  • barevn� kalibrace syst�mem GretagMecbeth a pr�ce s ICC profily
  • pro v�znamn� rukopisy individu�ln� kalibra�n� tabulky
  • nov� scanner CRUSE, mikroklimatizace, osv�tlen� na ateli�rov� �rovni, vysok� �etrnost i v�kon

�vod

Ve�ker� poskytov�n� digit�ln�ho obrazu za��n� rozhodnut�m v jak� kvalit� obraz vytvo�it a zaznamenat. Toto rozhodov�n� prob�h� a� p�ekvapiv� �asto jen na z�klad� subjektivn�ho pocit, nebo na z�klad� tradovan�ch nebo p�evzat�ch n�zor�. P�itom rozhodnut�, jak je pot�eba po�izovat a uchov�vat data, m��e zcela z�sadn� ovlivnit n�klady na projekty.
V dal��ch �vah�ch nech�me stranou vliv zvolen�ho form�tu pro ulo�en� dat. Budeme p�edpokl�dat, �e vznikaj�c� data sv�m obsa
hem vyhovuj� o�ek�v�n� u�ivatele. Budeme sledovat jen vlivy volby rozli�en� a komprese dat na informa�n� obsah.

Lze souhlasit s pravdivost� tvrzen�:

Z�kladn� technick� parametry digit�ln�ho obrazu tj. rozli�en� a typ komprese ur�uj� velikost vytv��en�ch dat.

Praktick�ho u�ivatele zaj�maj� dosa�iteln� a vyu�iteln� informace a dostane-li je, bude spokojen. Je mu zcela lhostejn� z jak objemn�ch dat sv� informace z�sk�. Lze v�ak polo�it rovn�tko mezi objem dat a mno�stv� informac�, kter� skute�n� obsahuj�?

Mysl�m, �e ne.

C�lem m�ho p��sp�vku je srozumiteln� a p�esv�d�iv� uk�zat, �e existuj� vlivy, kter� je nutno br�t v �vahu p�i rozhodov�n� o efektivn� volb� pou�it�ho rozli�en� a komprese.

Informa�n� obsah

Jak hodnotit mno�stv� a kvalitu zachovan� informace? P�i posuzov�n� hranic mo�nost� zachov�n� detailu ve fotografii se pou��vaj� ��rov� testy. Frekvence �ar (po�et �ar/mm), kter� filmov� materi�l spolehliv� zaznamen�, nazna�uje hranice mo�nosti z�znamu detail� na filmov� materi�l. Stejn� principy plat� p�iz�znamu elektrick�ch sign�l� reprezentuj�c�ch zvuk. V oblasti sign�lov� anal�zy je tato problematika velmi detailn� teoreticky zvl�dnuta. Na�la ji� d�vno sv� praktick� vyu�it� nejprve ve stanoven� technick�ch norem pro digit�ln� z�znam zvuku a posl�ze i v cel�m v�voji komprimovan�ho ukl�d�n� zvuku o jeho� ��elnosti nikdo nepochybuje. Podobn� v�vojov� trendy z�konit� pronikaj� i do oblasti zpracov�n� obrazu.

S promy�lenou komprimac� obrazov�ch dat, s optimalizovan�m a ��elu p�im��en�m rozli�en�m se setk�v�me d�v�me-li se na televizi, pou��v�me-li po��ta� a internet. P��chod nov�ch technologi� zpracov�n� a komprese obrazu vyu��v� logiku ji� d��ve dob�e zvl�dnutou a osv�d�enou v audio technice. Z�kladem je plnohodnotn� zachov�n� sign�l� nesouc�ch �lov�ku u�ite�nou informaci a v�dom� potla�en� ned�le�it�ch resp. �lov�kem nevyu�iteln�ch informac�.

P�esto p�i digitalizaci obrazu jsou n�kdy aplikov�na v souvislosti s kompres� a rozli�en�m obrazu pravidla, kter� p�i form�ln� aplikaci a hlavn� vytr�ena ze souvislosti, mohou p�sobit �kodliv� stejn� jako pov�ry.

M�m na mysli p�edev��m stanoven� limity rozli�en� a st�le se opakuj�c� pov�ra o �kodlivosti ztr�tov� komprese.

Trocha teorie

Existuj� v�ak v�bec exaktn� postupy jak stanovit pro dan� objekt objektivn� pot�ebn� rozli�en�? Samoz�ejm� ano, nicm�n� prakticky je vylou�eno prov�d�t takov�to v�zkum p�i ka�d� �vaze jak� rozli�en� aplikovat. P�esto zde nazna��m mo�n� postup, abych teoreticky od�vodnil n�sleduj�c� �vahy.

Furierova transformace je matematick� metoda, kter� dovoluje analyzovat pr�b�h libovoln�ho sign�lu a p�ev�st jej na sou�et sinusov�ch sign�l� vhodn�ch frekvenc� a amplitud. V obrazov�m �sign�lu� pak nejvy��� nalezen� frekvence odpov�daj� ��rov� frekvenci, kter� mus� b�t zaznamen�na.

��m je dan� tato nejvy��� frekvence?

Pro re�ln� p�edm�ty se bl�� nekone�nu, proto�e p�i ka�d�m dal��m p�ibl�en� nal�z�me nov� jemn�j�� detaily a toto zjem�ov�n� kon�� na molekul�rn� �rovni.

Prvn� omezen� je technick�. P�i digitalizaci je rozhoduj�c�m limituj�c�m prvkem po�et CCD pixel� p�ipadaj�c�ch na zobrazen� jednotky d�lky. Nejvy��� zachytiteln� ��rov� frekvence je v�ce ne� 2x ni��� ne� frekvence CCD prvk�.

Druh� omezen� stanov� u�ivatel t�m, �e ur�� hranici detail�, kter� ho je�t� zaj�maj�. Tato hranice mus� b�t ni��� (nejv��e stejn�) ne� hranice technick�.

T�et� omezen� je d�no z�znamem. Zvolen� rozli�en� z�znamu ur�uje nejvy��� zaznamenatelnou frekvenci podobn� jako je ur�ena maxim�ln� frekvence CCD prvku. Ji� z tohoto plyne , �e nem� smyl uchov�vat obraz v rozli�en� vy���m ne� je fyzick� rozli�en� sn�mac�ho za��zen�. Toto zd�nliv� zbyte�n� (proto�e zcela jasn�) konstatov�n� je nutn�, proto�e p�ekvapiv� �asto tato informace chyb� nebo je alespo� poskytov�na velmi nen�padn� (ploch� scannery, n�kter� kamerov� scanner y).

Pokud je p�edm�tem digitalizace zprost�edkovan� obraz (film), p�ib�v� dal�� omezen�. Pokud je maxim�ln� zaznamenan� frekvence vy��� ne� v��e uveden� omezen�, je v�e v po��dku. Pokud je ni���, st�v� se tato frekvence rozhoduj�c�. Jinak �e�eno, nascanujeme-li velmi kvalitn� neostr� film, chyb�j�c� informace neobnov�me.

(nev��te neomezen�mu zv�t�ov�n� detailu zn�m�mu z mnoha detektivek).

Jinak �e�eno, nejvy��� zaznamenan� frekvence je ur�ena nejhor��m �lenem z trojice
digitalizovan� objekt

digitaliza�n� za��zen�,

z�znam.

Objektivn� zn�me a m��eme snadno ��dit jen vlastnosti z�znamu. Z toho plyne z�sadn� �vaha:

  1. Zaznamen�v�me-li v�sledy digitalizace s dostate�n� vysok�m rozli�en�m, je zaznamenan� informa�n� obsah d�n jen digitalizovan�m objektem a digitaliza�n�m za��zen�m. Z�znam jej neomezuje. Tento informa�n� obsah se nem�n� ani pozd�j�� zm�nou rozli�en�, pokud toto rozli�en� (maxim�ln� zaznamenateln� frekvence) z�stane dostate�n� vy��� ne� odpov�d� informa�n�mu obsahu z�znamu.
  2. P okud je rozli�en� z�znamu ni��� (bl�zk�) ne� informa�n� obsah dan� digitalizovan�m objektem a digitaliza�n�m za��zen�m, je maxim�ln� zaznamenateln� frekvence dan� z�znamem.

V��e uveden� tvrzen� lze zm�nit na ot�zku:

Ur�uj� z�kladn� technick� parametry digit�ln�ho obrazu tj. rozli�en� a typ komprese mno�stv� uchovan�ch informac�? Odpov�� je:Ur�uj� maxim�ln� limity, informa�n� obsah v�ak m��e b�t men��.

Rozli�en�

Dovolte jeden ilustrativn� p��klad:

Na n�sleduj�c� str�nce jsou dv� trojice obraz�.

Prvn� p�edstavuje detaily z nascannovan� vizitky v t�chto rozli�en�ch

A:200 DPI, B:400 DPI a C:800DPI

Rozd�l je mezi subjektivn� vn�manou kvalitou je evidentn�. Zd� se, �e o rozd�lech v �rovni informa�n�ho obsahu net�eba diskutovat.

Ale pod�vejme se na n�sleduj�c� trojici. Tyto t�i obrazy jsou v�echny v rozli�en� 800DPI. Jde v�ak o identickou trojici jako v minul�m p��kladu. Pouze obrazy A a B byly matematicky p�evzorkov�ny do rozli�en� obrazu C.

Je jasn�, �e pouhou matematickou operac� nov� informace v obraze nevznikne. Subjektivn� vn�m�n� �kvality� ale ��k�, �e obr�zky jsou podstatn� lep��. Prvn� obr�zek je sice hor��, ne� druh�, ale druh� je prakticky identick� s t�et�m. Z toho lze vyvodit na z�klad� p�edchoz�ch teoretick�ch �vah jednozna�n� z�v�r:

Informa�n� obsah obrazu nascannovan�ho pro 400 DPI je identick� s obrazem nascannovan�m na 800DPI.

Lze tedy ��ci, �e v informa�n�m obsahu obr�zku B a C nen� v�znamn� rozd�l, a� je pom�r jejich velikost� 1:4.

Naopak - proto�e existuje z�eteln� rozd�l mezi p�evzorkovan�m obrazem A a B, je z�ejm�, �e informa�n� obsah obrazu B je vy��� ne� obrazu A.

Konzultac� tohoto jevu s v�robcem scanneru mi bylo potvrzeno, �e scanner hardwarov� poskytuje obraz v rozli�en� cca 350 DPI. Tento obraz je ihned p�epo��t�v�n na rozli�en� po�adovan� u�ivatelem - u tohoto scanneru a� na 9600 DPI (!). Je ale z�ejm�, �e informa�n� obsah bude i p�i tomto ��len�m rozli�en� stejn� jako u prvotn�ch dat � tedy 350 DPI. Rozd�l je tedy jen v subjektivn�m dojmu z obrazu a pochopiteln� ve velikosti dat.

D�le�it� je si uv�domit, �e pro �pln� uchov�n� v�sledk� digitalizace sta�� zachovat prvotn� data. Na vy��� rozli�en� lze obraz roz���it kdykoli pozd�ji dle pot�eby. Mnoh� zobrazovac� softwary tuto konverzi prov�d�j� automaticky ( um� to nap��klad WORD p�i vkl�d�n� obrazu do textu).

Nen� tedy nutno uchov�vat (p��padn� p�en�et) zbyte�n� �na�echran� data. Mo�nost �spory z�znamov�ho prostoru nebo kapacit pro p�enos dat je evidentn�. Je v�dy ��eln� p�en�st jen nutnou informaci a tu pak u u�ivatele konvertovat tak, aby byla vn�mateln� l�pe.

Detail obrazu nascannovan�ho na ploch�m scanneru p�i zadan�m rozli�en�

 

A: 200DPPI B: 400DPI C: 800 DPI

 

A p�evzorkov�no bikubicky B p�evzorkov�no bikubicky

na 800DPI na 800DPI 800DPI

S t�mito obrazy lze ud�lat je�t� jeden pokus. Jestli�e obraz C (800 DPI) p�evzorkujeme na 400 a 200DPI a pak tyto

obrazy p�evedeme zase zp�t na rozli�en� 800 DPI, uvid�me kter� sn�en� rozli�en� p�ineslo ztr�tu informace.

T�m zjist�me kde le�� �rove� vyu�iteln�ch informac� v obraze. V�sledky pokusu jsou identick� s d��ve uveden�m. Lze z nich zhruba vyvodit, �e chceme-li zachovat informa�n� obsah obrazu, sta�� jej ukl�dat v rozli�en� zhruba 400 DPI.

Uvedu je�t� jin� p��klad.

Na mikrofilmu je ji� informa�n� obsah ovlivn�n vlastnostmi media. Po digitalizaci mikrofilmu tedy informa�n� obsah odpov�d� mo�nostem filmu a digitalizace. V�m, �e scanner SunRise dovoluje velmi dob�e vyu��t pln�ho rozli�en� CD prvku. Informa�n� obsah tedy bude d�n tak�ka v�hradn� vlastnostmi scannovan�ho filmu, nikoli vlastnostmi za��zen�. Jde o obr�cenou situaci ne� v p�edchoz�m p��klad�, kdy kvalita origin�lu (jeho informa�n� obsah) v�razn� p�esahovala mo�nost� za��zen�.

P�vodn� obraz je posledn� vpravo a odpov�d� rozli�en� origin�lu cca 400 DPI. Tento obraz byl p�evzorkov�n na 100,150�350 DPI a pak p�evzorkov�n zp�t na 400DPI. Pokud jsou v obraze informace vy�aduj�c� vy��� rozli�en� ne� je pou�ito v mezikroku, obraz se znateln� zhor��, proto�e tyto informace nebylo mo�n� uchovat a p�i n�vratu do vy���ho rozli�en� se neobnovily, byly tedy odstran�ny.

100 DPI 150 DPI 200 DPI 250 DPI 300 DPI 400 DPI

 

S�rie pohled� dokumentuje, �e ke znateln�mu zhor�en� informa�n�ho obsahu doch�z� a� p�i poklesu rozli�en� pod 200 DPI, tedy pro obraz 4x men�� ne� maxim�ln�.

Film tedy obsahuje tolik informac�, �e pro jejich zachov�n� je nutn� pou��t rozhodn� v�ce ne� 150 DPI. Dobr� je ji� rozli�en� 200 DPI (s rezervou pro jistotu nejv��e 250-300DPI).

Z�v�r:

Informa�n� obsah digitalizovan�ho objektu a vlastnosti digitaliza�n�ho za��zen� ur�uj� ��eln� rozli�en�, kter� minim�ln� m� b�t pro uchov�n� digit�ln� informace pou�ito.

Pou�it� ni���ho rozli�en� znamen� ztr�tu ji� vznikl� informace.

Pou�it� vy���ho rozli�en� znamen� ne��eln� n�r�st objemu dat, proto�e informa�n� obsah se nem�n�.

Hranice samoz�ejm� nen� ostr�, nutno pracovat s jistou rezervou, nicm�n� s v�dom�m, �e n�r�st objemu dat je vzhledem k rozli�en� kvadratick� a m��e b�t zbyte�n�.

Samotn� �daj o rozli�en� obrazu neposkytuje informaci o skute�n�m informa�n�m obsahu digit�ln�ho obrazu, sd�luje jen nejvy��� �rove�, kter� m��e b�t dosa�eno.

 

Ztr�tov� komprese

Ob�asn� odm�t�n� ztr�tov� komprese jist� souvis� se sl�vkem �ztr�tov� , kter� vzbuzuje obavy a ned�v�ru.

Porovnejme vliv ztr�tov� komprese kter� vede ke zmen�en� soubor� na 1/3, 1/10 a m�rn�ho zaost�en� obrazu.

Ulo�en� obrazu v JPG, Photoshop 5.0.

Nejvy��� kvalita (10), komprese 3x St�edn� kvalita (5), komprese 11x Zaost�en�

 

N�sleduj�c� obrazy vznikly ode�ten�m obrazu od origin�ln�ho, vyjad�uj� tedy �deformaci� t�chto obr�zk�.

Pro n�zornost je tento obraz upraven zv�razn�n�m zv��en�m jasu (+100) a kontrastu (+40).
Obraz identick� s origin�lem by poskytl �edou plochu.

 

Odpov�daj�c� histogramy ukazuj� jak se zm�nil p�vodn� obraz kompres� nebo zaost�en�m.

 

 

Nejv�t�� zm�ny p�ineslo, jak je vid�t, zaost�en� obrazu.

Funkce zost�en� i jin�ch �prav b�vaj� implementov�ny ji� do procesu prvotn�ho po�izov�n� dat. P�itom jejich vliv na zm�nu informa�n�ho obsahu je, jak je vid�t,v�t�� p��padn� srovnateln� se zm�nami ze ztr�tov� komprese.

Ulo�en� obrazu v JPG nejvy��� kvalit� p�ineslo v podstat� jen odchylky nejv��e +/- 2 bit (p�i bli��� prohl�dce zjist�me, �e p�edev��m v bl�zkosti hran). To odpov�d� z�kladn�m variac�m, kter� lze zjistit nap��klad v nascannovan� homogenn� (nap��klad kalibra�n�) �ed� plo�e. Pro re�ln� pap�r nebo pergamen se tyto odchylky na homogenn� plo�e pohybuj� do +/- 5. Jevy zp�soben� kompres� jsou tedy bezpe�n� maskov�ny p�irozen�mi vlastnostmi p�edlohy.

P�i ulo�en� dat v JPG p�i vy��� kompresi ji� m��e zku�en� oko rozpoznat vznikaj�c� efekty, ty v�ak nevedou ke ztr�t� informace, kter� je nesena p�edev��m hranami a liniemi v obrazu. Teprve vysok� komprese znateln� degraduje hrany a efekty jsou dob�e viditeln�, ostrost kles�.

Vysok� komprese v�ak m��e b�t kompenzov�na vy���m rozli�en�m.

N�sleduj�c� obrazy poch�zej� ze dvou p�ibli�n� stejn� velk�ch (cca 65 kB) soubor�.

Posu�te sami subjektivn� �rove� informa�n�ho obsahu.

JPG, 40 DPI, vysoce ztr�tov� komprese (2) TIF, 10 DPI (bezeztr�tov� ulo�en�)

Kalibrace

Po�adavky na kalibraci je�t� d�le komplikuj� ot�zku co je t�m spr�vn�m, digit�ln�m obrazem, kter� m� b�t archivov�n. Obecn� lze ��ci, �e rozd�ly mezi kalibrovan�m a nekalibrovan�m obrazem jsou obvykle ��seln� v�razn� v�t�� ne� v��e nazna�en� zm�ny zp�soben� ztr�tovou kompres�. P�itom poskytov�n� obraz� v definovan�m ICC profilu v oblasti digitalizace pro archivaci je st�le sp�e v�jimkou.

Shrnut�

Ztr�tov� komprimace dat p�i komunikaci po Internetu je samoz�ejmost�. P�ich�zej� nov� technologie zp��stup�ov�n� dat, kter� d�le zvy�uj� ��innost komprimace pln�m vyu��v�n�m dan�ho datov�ho prostoru pouze pro uchov�n�/p�enos �lov�kem vyu�iteln�ch informac�.

Prvn�m �l�nkem tohoto �et�zu v�ak v�dy z�stane po�izov�n� dat. Proto ji� v tomto kroku je t�eba zva�ovat nejen vlastnosti vznikaj�c�ch dat z hlediska po�adavk� u�ivatele, ale i z hlediska spr�vnosti a efektivity jejich ulo�en�.

 

Uk�zka optim�ln�ho obrazu digitalizovan� mapy po��zen�ho scannovac� kamerou CRUSE SL 285.


 

Logo STUDIO aha! Grafick� design 
© 2001 Studio aha!
Digital Art Studio �vodn� animace 
© 2001 Digital Art Studio

© 2001 Albertina icome Praha s.r.o.
INFORUM® a IN® jsou registrovan� obchodn� zn�mky.
V�echna pr�va vyhrazena. Na va�e p�ipom�nky se t�� webmaster. Aktualizov�no 27.05.2001