Registrace a zpřístupňování elektronických zdrojů publikovaných v síti Internet
Ludmila Celbová, Národní knihovna ČR, Praha
Exploze v elektronickém publikování, tj. tvorbě elektronických zdrojů přístupných zejména v síti Internet vyžaduje nový přístup ke zpracování, ochraně a zpřístupňování těchto informací. Národní bibliografie má zachycovat vedle "tradičních" dokumentů i dokumenty elektronické, včetně dálkově přístupných elektronických zdrojů jako součást národní produkce a národního kulturního dědictví. Ve světě existuje s projekty zaměřenými na elektronické sbírky již několikaletá zkušenost. V České republice se jedná o oblast zcela nových činností. V Národní knihovně České republiky vznikl projekt podporovaný Ministerstvem kultury České republiky, zaměřený na vytvoření metodických, technických, organizačních a právních podmínek pro zajištění trvalého přístupu k domácím elektronickým zdrojům publikovaným v síti Internet.

Co znamená Česká národní bibliografie?

K základním úkolům Národní knihovny České republiky patří doplňování a trvalé uchovávání fondu bohemikálních dokumentů vydaných v ČR a v zahraničí jako součásti národního historického a kulturního dědictví.

Při plnění tohoto poslání spolupracuje Národní knihovna ČR úzce s vydavateli v České republice. Významnou roli zde hraje povinný výtisk, systémy ISBN, ISMN, ISSN a CIP. Označování dokumentů mezinárodními čísly publikací i využívání systému katalogizace v knize je zatím v České republice dobrovolné. Pokud jde o povinný výtisk, jedná se o povinnost, kterou ukládají vydavatelům zákony (dodávání Národní knihovně ČR a dalším určeným knihovnám). V případě neperodických publikací zasílají vydavatelé určeným knihovnám “rozmnoženiny literárních, vědeckých a uměleckých děl určené k veřejnému šíření, které jsou vydávány jednorázově, popřípadě nejvýše jednou ročně anebo po částech i častěji, tvoří-li obsahově jeden celek”. Zákon upravující povinný výtisk seriálových publikací se týká periodického tisku.

Pro Národní knihovnu ČR představuje povinný výtisk publikací hlavní zdroj získávání dokumentů pro uchování národního bohatství, ale současně i značnou odpovědnost za tuto činnost. Pro nakladatele znamená archivace dokumentů v konzervačním fondu uchování jejich publikací pro budoucnost; zveřejňování bibliografických informací o vydání publikací v České národní bibliografii (ČNB) a v bibliografii časopisu Nové knihy zpřístupňuje informace uživatelům a potenciálním zákazníkům nejen v Česku, ale po celém světě. Těmito prostředky si nakladatelé mohou zajistit snadný způsob širokého zpřístupnění informací o své produkci, zviditelnění na knižním trhu a propagaci svých publikací.

Národní knihovna ČR vytváří a publikuje Českou národní bibliografii. Ta zahrnuje širokou škálu publikací vydaných v České republice nebo publikací vydaných v kterékoliv zemi, ovšem od českých autorů nebo týkajících se České republiky (bohemika) a získaných na základě zákona o povinném výtisku, nákupem, darem či výměnou. Tato bibliografie dokumentuje českou produkci publikací a je pro tuzemské i zahraniční knihovny a informační centra důležitým zdrojem referenčním, zdrojem pro katalogizaci i pro objednávání. ČNB byla v minulosti vydávána v tištěné podobě; nyní je k dispozici v elektronické podobě, a to jak na discích CD-ROM, tak na Internetu.

 

 

Elektronické publikace a ČNB

Pod elektronickými dokumenty se v souvislosti se zákony týkajícími se povinného výtisku dosud chápaly dokumenty uložené na hmotných elektronických nosičích. Současný posun směrem k elektronickému publikování v síťovém prostředí představuje mnoho zcela nových problémů souvisejících s národní bibliografií a s uchováním těchto dokumentů jako národního dědictví. Pro identifikaci, získávání, evid enci, archivaci a zpřístupňování síťových elektronických publikací je třeba stanovit zvláštní politiku. K elektronickým publikacím na Internetu je přístup prostřednictvím protokolů jako je přenos souborů (ftp), přenos hypertextu (http), telnet, elektronická pošta. Pokud se tyto publikace nebudou získávat a uchovávat v konzervačních fondech, vznikne v národním kulturním dědictví a v badatelských zdrojích velká mezera.

Národní knihovna ČR připravila návrh projektu na řešení problematiky získávání, uchovávání a zpřístupňování síťových elektronických publikací a získala finanční podporu Ministerstva kultury ČR na řešení tohoto úkolu v rámci projektů výzkumu a vývoje v letech 2000-2001. Jedná se o pilotní projekt, jehož cílem je připravit podmínky pro zachycení dálkově přístupných (síťových) elektronických zdrojů v České národní bibliografii a zajištění jejich trvalého zpřístupnění. Projekt by měl umožnit propojení s fondy elektronických publikací v zahraničí.

 

 

Elektronické publikace – výzva pro národní (depozitní) knihovny i vydavatele

Elektronická publikace je publikovaný dokument, v němž jsou informace digitálně zakódovány a který je přístupný ve strojem čitelné podobě. Zahrnuje publikace off-line (fyzická forma) jako CD-ROMy a diskety a publikace on-line uchovávané použitím digitálních technologií.

Síťová elektronická publikace je digitálně zakódovaný informační zdroj, který je zpřístupněný veřejnosti prostřednictvím komunikační sítě. Všechny dálkově přístupné (síťové) elektronické zdroje jsou z hlediska bibliografického popisu považovány za publikované.

Vydavatel je osoba nebo organizace odpovědná za vydání dokumentu.

Exploze v elektronickém publikování, tj. zejména v tvorbě elektronických zdrojů přístupných v síti Internet, vyžaduje nový přístup ke zpracování, ochraně a zpřístupňování těchto informací. Dálkově přístupné elektronické zdroje se stávají nedílnou součástí národní produkce a národního kulturního dědictví, i “obrazem doby”, který je třeba zachytit a uchovat pro budoucnost. Informace publikované v síti jsou však složitější než jiné druhy dokumentů, elektronické dokumenty mohou být dynamické a nelze je snadno vyčlenit pro účely konzervace.

Narůstající globalizace informací a vydavatelského průmyslu podněcuje otázku: “Které publikace přispívají ke kulturnímu dědictví?”. Není reálné uchovávat ve smyslu národní bibliografie veškerou národní produkci elektronických síťových publikací, z nichž mnohé mají velmi pomíjivou hodnotu, nýbrž je třeba stanovit určitá kritéria výběru těchto publikací.

Ve světě (zejména v USA, Kanadě, Austrálii a v evropských severských zemích) existuje již několikaletá zkušenost s projekty zaměřenými na sbírky elektronických publikací. V Evropě se za podpory Evropské komise zabývají touto problematikou společné mezinárodní projekty (CoBRA, BIBLINK, NEDLIB), jejichž cílem je stanovit budoucí úlohu evropských národních knihoven ve vztahu k elektronickým publikacím a vytvořit podmínky pro propojení národních bibliografických agentur a vydavatelů elektronických publikací, které by bylo užitečné pro obě strany.

 

V zásadě je třeba řešit několik důležitých problémů:

 

 

Výběr elektronických zdrojů pro registraci a archivaci

Národní bibliografie by měla registrovat dokumenty v úplnosti, tato úplnost je však i u tradičních dokumentů “výběrová”, tzn. že některé typy dokumentů nejsou zahrnuty do konzervačního fondu (např. reklamní tiskoviny, publikace nevydané pro širší veřejnost). Také elektronické dokumenty by měly být registrovány (a event. ukládány v konzervačním fondu) v relativní úplnosti, a to v souladu s celkovou politikou budování fondu příslušné knihovny. V každém případě by se mělo jednat o dokumenty původně elektronické, tedy neměly by být zahrnuty elektronické publikace, které jsou pouhou kopií tištěné verze.

 

 

Zajištění trvalého přístupu k elektronickým zdrojům publikovaným v síti

Zajištění dlouhodobého přístupu k síťovým elektronickým publikacím předpokládá kooperaci knihoven, vydavatelů i autorů.

Online elektronické publikace, určené pro dlouhodobé uložení v konzervačním fondu knihovny/-en (podle stanovených kritérií výběru), by se měly ukládat na archivním serveru. S tím souvisí řešení trvalé dostupnosti informací obsažených v dokumentu při změnách nosičů, formátů, software, hardware.

Pro ostatní publikace se počítá alespoň se zajištěním trvalého přístupu ke zdrojům pomocí jednoznačných identifikátorů (URN, DOI). Tyto identifikátory by měly sloužit jako trvalá adresa elektronického zdroje nebo jako obdoba současných mezinárodních standardních čísel používaných pro monografie, seriály a hudebniny (ISBN, ISSN, ISMN). Například protokol URN (unifikovaný název zdroje) by měl vybavit internetové zdroje trvalým jménem, které je nezávislé na lokaci a obecně jednoznačné.

 

 

Získávání elektronických zdrojů pro konzervační fond

Ukládání elektronických publikací na archivní server nelze provádět bez souhlasu vydavatele. Ve většině zemí, kde se projekty týkající se uchování těchto zdrojů řešily již v dřívějších letech, bylo uzákoněno (nebo se zákon připravuje) právo depozitních knihoven na “povinný výtisk”, a dočasně se řeší archivace těchto dokumentů formou dohody s vydavateli. Povinný výtisk podložený zákonem je obvyklým prostředkem, kterým depozitní knihovny mohou zajistit, aby kulturní dědictví bylo zachováno pro budoucnost.

S archivováním elektronických publikací souvisí stanovení podmínek přístupu k archivovaným elektronickým zdrojům. Zpřístupňování těchto dokumentů musí vyhovovat autorskému právu, tzn. je třeba zajistit ochranu proti neoprávněnému využívání a kopírování archivovaných publikací.

Ověřování autentičnosti elektronických publikací

Pro zjišťování nových verzí elektronických dokumentů publikovaných v síti existují automatické prostředky, které ovšem nejsou schopny posoudit rozsah změn a tudíž stanovit podle určitých kritérií, zda se jedná o skutečnou obsahově novou verzi. Pro konzervační fond je třeba zajistit archivaci původní verze připravené vydavatelem/výrobcem dokumentu. Ověřování autentičnosti by mohl poměrně snadno napomoci soubor údajů Dublin Core, který může nabídnout nakladatelům jednoduchý mechanismus pro vyplňování potřebných údajů ve zdroji, včetně indentifikačních údajů pro označení verze publikace.

Také pro vyhledávání změn v internetových adresách (URL) uvedených v dokumentech lze použít automatizovaných nástrojů.

 

 

Organizace a řízení virtuálních elektronických publikací

Díky mobilitě a nestabilnosti elektronických informačních zdrojů ve virtuálním prostoru není bibliografická kontrola těchto dokumentů zdaleka tak snadná jako u fyzických nosičů. Potřebnost bibliografické kontroly u síťových elektronických publikací je předmětem intenzivních debat. Oponenti myšlenky knihovnického přístupu, tj. bibliografického zpracování, argumentují, že není v lidských možnostech zachytit veškerou produkci publikací v síti, která stále narůstá a přitom se může neustále měnit. Zvažuje se možnost využití vyhledávacích strojů a velkokapacitních paměťových médií pro průběžné ukládání (archivaci) veškeré produkce. V tomto případě se ovšem z koncepce vytrácí smysl národní registrující bibliografie.

Velké katalogizační agentury (např. OCLC) používají propracované bibliografické standardy jako AACR2, ISBD(ER) a formáty MARC. Využití těchto standardů umožňuje kooperativní zpracování s využitím nadstavbových systémů pro věcný popis a vyhledávání a také integraci tištěných i elektronických zdrojů v jediném knihovnickém systému.

Závažný problém organizace přístupu k síťovým elektronickým zdrojům vzniká z nespolehlivosti internetových adres (URL), které se často mění. Pokud dojde k nekontrolované změně URL, důsledky se projeví ve všech dokumentech uvádějících toto URL (odkazy v dokumentech na webu nebo v bibliografických záznamech). Stabilitu adres nabízí řešení programu IETF (Internet Engineering Task Force) – vývoj identifikátorů URI (Uniform Resource Identifiers), např. URN (Uniform Resource Name) jako trvalý název internetovského zdroje.

Také pro popis síťových informačních zdrojů umístěný přímo v dokumentu bylo potřeba vyvinout jednotný standard metadatových prvků. V současné době se zdá, že se svět knihovníků i pracovníků z oblasti IT sjednotil na souboru metadatových prvků Dublin Core (DC Metadata Set). Jde o obdobu CIP, které u elektronických publikací může pomocí standardizace metadat obsažených ve zdroji zvýšit kvalitu popisu síťových elektronických zdrojů, sloužit jako kontrolní mechanismus pro jiné knihovny, zlepšit identifikaci a autentičnost vyhledaných zdrojů, napomáhat sdílené katalogizaci i při vyhledávání.

Vyvíjejí se softwarové nástroje umožňující vydavatelům jednoduchý a jednotný zápis potřebných údajů ve zdroji a nástroje pro převod dat z formátu DC do formátu MARC.

 

Závěr

Na většinu složitých činností souvisejících se získáváním, zpracováním, ochranou a zpřístupňováním lze použít speciálních softwarových a hardwarových prostředků, které lidskou práci dokonale nahradí, nebo alespoň usnadní, a přispějí k vyšší kvalitě. Nicméně, pokud má národní bibliografie přetrvat i v oblasti dálkově přístupných elektronických zdrojů, bude zde hrát i nadále podstatnou roli intelektuální lidská činnost, kterou pro výběr dokumentů nelze nahradit automatickou činností strojů.

 

 

Použité informační zdroje

  1. National Library of Canada Electronic Collection [online]. [Ottawa (Kanada)] : NLC, revised 1999-09-07 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://collection.nlc-bnc.ca/e-coll-e/index-e.htm>.
  2. Internet Cataloging Project : Call for Participation [online]. Dublin (Ohio, USA) : OCLC, 1996 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.oclc.org/oclc/man/catproj/catcall.htm>.
  3. Preservation Resources [online]. Dublin (Ohio, USA) : OCLC, c1998, last updated March 9, 2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.oclc.org/oclc/presres/>.
  4. InterCAT : a Catalog of Internet Resources [online]. Dublin (Ohio, USA) : OCLC [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://orc.rsch.oclc.org:6990/>.
  5. PANDORA Project : Preserving and Accessing Networked Documentary Resources of Australia [online]. Canberra (Austrálie) : National Library of Australia, last updated 10-Apr-2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://pandora.nla.gov.au/pandora/>.
  6. National Strategy for Provision of Access to Australian Electronic Publications: a National Library of Australia Position Paper [online]. Canberra (Austrálie) : National Library of Australia, last updated 07-Dec-1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.nla.gov.au/policy/paep.html>.
  7. INDOREG. Internet Document Registration Project Report [online]. Ballerup (Dánsko) : Dansk Biblioteks Center, 1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.purl.dk/rapport/html.uk>.
  8. Kulturarw3 Heritage Project [online]. Stockholm (Švédsko) : Royal Library, 1998-1999, updated 1999-06-09 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.svesok.kb.se/info>.
  9. Projects at the Royal Library in Stockholm, Sweden [online]. Stockholm : Royal Library, updated July 1, 1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.kb.se/ENG/projekt.htm>.
  10. HAKALA, Juha. Description of the Nordic Metadata project: Cataloguing, Indexing and Retrieval of Digital Documents [online]. Helsinki (Finsko) : Helsinki University Library, [1996] [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://linnea.helsinki.fi/meta/projplan.html>.
  11. Metadata. Bath (Anglie) : UKOLN, last updated 16-Feb-2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.ukoln.ac.uk/metadata/>.
  12. Expert centre - National Library [online]. Haag (Holandsko) : National Library of the Netherlands [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.kb.nl/kb/resources/frameset_kenniscentrum-en.html>.
  13. Cobra+ : Computerised Bibliographic Record Actions [online]. Boston Spa (Velká Británie) : COBRA+, 1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://portico.bl.uk/gabriel/en/projects/cobra.html>.
  14. BIBLINK [online]. Bath (Anglie) : UKOLN, last updated 12-Oct-1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://hosted.ukoln.ac.uk/biblink/>.
  15. NEDLIB – Networked European Deposit Library [online]. Den Haag : Koninklijke Bibliotheek, [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.kb.nl/coop/nedlib/>.
  16. EVA : the acquisition and archiving of electronic network publications [online]. Helsinki (Finsko) : Helsinki University Library, updated 1997-12-15 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://renki.helsinki.fi/eva/english.html>.
  17. Dublin Core Metadata Initiative [online]. Dublin (Ohio, USA) : OCLC, c2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://purl.org/dc/>.
  18. OLSON, Nancy B. Cataloging Internet Resources [online]. Second edition. Dublin (Ohio, USA) : OCLC, c1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.purl.org/oclc/cataloging-internet>.
  19. Dublin Core Czech [online]. Brno : Masarykova univerzita, c1999 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.ics.muni.cz/dublin_core/DC-czech.html>.
  20. The Nordic Metadata projects [online]. Helsinki (Finsko) : Helsinki University, 1996, last updated 21 February 2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://linnea.helsinki.fi/meta/>.
  21. KOCH, Traugott; BORELL, Mattias. Dublin Core Metadata Template [online]. Lund (Švédsko) : Lund universitetsbibliotek, 1997, last update 1997-08-20 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.lub.lu.se/metadata/DC_creator.html>.
  22. d2m : Dublin Core to MARC converter [online]. Trondheim (Norsko) : BIBSYS, 1998, last update 1998-05-18 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.bibsys.no/meta/d2m>.
  23. Nordic Countries URN-generator : proviede by the Nordic Libraries [online]. Lund (Švédsko) : Lund universitetsbibliotek, 1997 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.lub.lu.se/cgi-bin/nmurn.pl>.
  24. DOI : the Digital Object Identifier System [online]. Kidlington (Oxford, Velká Británie) : International DOI Foundation, 1998, updated 4 April 2000 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.doi.org/>.
  25. Uniform Resource Names (urn) Charter [online]. Reston (VA, USA) : IETF, last modified 03-Jun-99 [cit. 10. dubna 2000]. Dostupné na World Wide Web: <http://www.ietf.org/html.charters/urn-charter.html>.