Registrace a zpřístupňování elektronických zdrojů publikovaných v síti Internet | |
Ludmila Celbová, Národní knihovna ČR, Praha | |
Exploze v elektronickém publikování, tj. tvorbě elektronických zdrojů přístupných zejména v síti Internet vyžaduje nový přístup ke zpracování, ochraně a zpřístupňování těchto informací. Národní bibliografie má zachycovat vedle "tradičních" dokumentů i dokumenty elektronické, včetně dálkově přístupných elektronických zdrojů jako součást národní produkce a národního kulturního dědictví. Ve světě existuje s projekty zaměřenými na elektronické sbírky již několikaletá zkušenost. V České republice se jedná o oblast zcela nových činností. V Národní knihovně České republiky vznikl projekt podporovaný Ministerstvem kultury České republiky, zaměřený na vytvoření metodických, technických, organizačních a právních podmínek pro zajištění trvalého přístupu k domácím elektronickým zdrojům publikovaným v síti Internet. |
Co znamená Česká národní bibliografie?
K základním úkolům Národní knihovny České republiky patří doplňování a trvalé uchovávání fondu bohemikálních dokumentů vydaných v ČR a v zahraničí jako součásti národního historického a kulturního dědictví.
Při plnění tohoto poslání spolupracuje Národní knihovna ČR úzce s vydavateli v České republice. Významnou roli zde hraje povinný výtisk, systémy ISBN, ISMN, ISSN a CIP. Označování dokumentů mezinárodními čísly publikací i využívání systému katalogizace v knize je zatím v České republice dobrovolné. Pokud jde o povinný výtisk, jedná se o povinnost, kterou ukládají vydavatelům zákony (dodávání Národní knihovně ČR a dalším určeným knihovnám). V př
ípadě neperodických publikací zasílají vydavatelé určeným knihovnám “rozmnoženiny literárních, vědeckých a uměleckých děl určené k veřejnému šíření, které jsou vydávány jednorázově, popřípadě nejvýše jednou ročně anebo po částech i častěji, tvoří-li obsahově jeden celek”. Zákon upravující povinný výtisk seriálových publikací se týká periodického tisku.Pro Národní knihovnu ČR představuje povinný výtisk publikací hlavní zdroj získávání dokumentů pro uchování národního bohatství, ale současně i značnou odpovědnost za tuto činnost. Pro nakladatele znamená archivace dokumentů v konzervačním fondu uchování jejich publikací pro budoucnost
; zveřejňování bibliografických informací o vydání publikací v České národní bibliografii (ČNB) a v bibliografii časopisu Nové knihy zpřístupňuje informace uživatelům a potenciálním zákazníkům nejen v Česku, ale po celém světě. Těmito prostředky si nakladatelé mohou zajistit snadný způsob širokého zpřístupnění informací o své produkci, zviditelnění na knižním trhu a propagaci svých publikací.Národní knihovna ČR vytváří a publikuje Českou národní bibliografii. Ta zahrnuje širokou škálu publikací vydaných v České republice nebo publikací vydaných v kterékoliv zemi, ovšem od českých autorů nebo týkajících se České republiky (bohemika) a získaných na základě zákona o povinném výtisku, nákupem, darem či výměnou. Tato bibliografie dokumentuje českou produkci publikací a je pro tuzemské i zahraniční knihovny a informační centra důležitým zdrojem referenčním, zdrojem pro katalogizaci i pro objednávání. ČNB byla v minulosti vydávána v tištěné podobě
; nyní je k dispozici v elektronické podobě, a to jak na discích CD-ROM, tak na Internetu.
Elektronické publikace a ČNB
Pod elektronickými dokumenty se v souvislosti se zákony týkajícími se povinného výtisku dosud chápaly dokumenty uložené na hmotných elektronických nosičích. Současný posun směrem k elektronickému publikování v síťovém prostředí představuje mnoho zcela nových problémů souvisejících s národní bibliografií a s uchováním těchto dokumentů jako národního dědictví. Pro identifikaci, získávání, evid
enci, archivaci a zpřístupňování síťových elektronických publikací je třeba stanovit zvláštní politiku. K elektronickým publikacím na Internetu je přístup prostřednictvím protokolů jako je přenos souborů (ftp), přenos hypertextu (http), telnet, elektronická pošta. Pokud se tyto publikace nebudou získávat a uchovávat v konzervačních fondech, vznikne v národním kulturním dědictví a v badatelských zdrojích velká mezera.Národní knihovna ČR připravila návrh projektu na řešení problematiky získávání, uchovávání a zpřístupňování síťových elektronických publikací a získala finanční podporu Ministerstva kultury ČR na řešení tohoto úkolu v rámci projektů výzkumu a vývoje v letech 2000-2001. Jedná se o pilotní projekt, jehož cílem je připravit podmínky pro zachycení
dálkově přístupných (síťových) elektronických zdrojů v České národní bibliografii a zajištění jejich trvalého zpřístupnění. Projekt by měl umožnit propojení s fondy elektronických publikací v zahraničí.
Elektronické publikace – výzva pro národní (depozitní) knihovny i vydavatele
Elektronická publikace
je publikovaný dokument, v němž jsou informace digitálně zakódovány a který je přístupný ve strojem čitelné podobě. Zahrnuje publikace off-line (fyzická forma) jako CD-ROMy a diskety a publikace on-line uchovávané použitím digitálních technologií.Síťová elektronická publikace je digitálně zakódovaný informační zdroj, který je zpřístupněný veřejnosti prostřednictvím komunikační sítě. Všechny dálkově přístupné (síťové) elektronické zdroje jsou z hlediska bibliografického popisu považovány za publikované.
Vydavatel
je osoba nebo organizace odpovědná za vydání dokumentu.Exploze v elektronickém publikování, tj. zejména v tvorbě elektronických zdrojů přístupných v síti Internet, vyžaduje nový přístup ke zpracování, ochraně a zpřístupňování těchto informací. Dálkově přístupné elektronické zdroje se stávají nedílnou součástí národní produkce a národního kulturního dědictví, i “obrazem doby”, který je třeba zachytit a uchovat pro budoucnost. Informace publikovan
é v síti jsou však složitější než jiné druhy dokumentů, elektronické dokumenty mohou být dynamické a nelze je snadno vyčlenit pro účely konzervace.Narůstající globalizace informací a vydavatelského průmyslu podněcuje otázku: “Které publikace přispívají ke kulturnímu dědictví?”. Není reálné uchovávat ve smyslu národní bibliografie veškerou národní produkci elektronických síťových publikací, z nichž mnohé mají velmi pomíjivou hodnotu, nýbrž je třeba stanovit určitá kritéria výběru těchto publikací.
Ve světě (zejména v USA, Kanadě
, Austrálii a v evropských severských zemích) existuje již několikaletá zkušenost s projekty zaměřenými na sbírky elektronických publikací. V Evropě se za podpory Evropské komise zabývají touto problematikou společné mezinárodní projekty (CoBRA, BIBLINK, NEDLIB), jejichž cílem je stanovit budoucí úlohu evropských národních knihoven ve vztahu k elektronickým publikacím a vytvořit podmínky pro propojení národních bibliografických agentur a vydavatelů elektronických publikací, které by bylo užitečné pro obě strany.
V zásadě je třeba řešit několik důležitých problémů:
Výběr elektronických zdrojů pro registraci a archivaci
Národní bibliografie by měla registrovat dokumenty v úplnosti, tato úplnost je však i u tradičních dokumentů “výběrová”, tzn. že některé typy dokumentů nejsou zahrnuty do konzervačního fondu (např. reklamní tiskoviny, publikace nevydané pro širší veřejnost). Také elektronické dokumenty by měly být regist
rovány (a event. ukládány v konzervačním fondu) v relativní úplnosti, a to v souladu s celkovou politikou budování fondu příslušné knihovny. V každém případě by se mělo jednat o dokumenty původně elektronické, tedy neměly by být zahrnuty elektronické publikace, které jsou pouhou kopií tištěné verze.
Zajištění trvalého přístupu k elektronickým zdrojům publikovaným v síti
Zajištění dlouhodobého přístupu k síťovým elektronickým publikacím předpokládá kooperaci knihoven, vydavatelů i autorů.
Online elektronické publikace, určené pro dlouhodobé uložení v konzervačním fondu knihovny/-en (podle stanovených kritérií výběru), by se měly ukládat na archivním serveru. S tím souvisí řešení trvalé dostupnosti informací obsažených v dokumentu při změnách nosičů, formátů, software, hardware.
Pro ostatní publikace se počítá alespoň se zajištěním trvalého přístupu ke zdrojům pomocí jednoznačných identifikátorů (URN, DOI). Tyto identifikátory by měly sloužit jako trvalá adresa elektronického zdroje nebo jako obdoba současných mezinárodních standardních čísel používaných pro monografie, seriály a hudebniny (ISBN, ISSN, ISMN). Například protokol URN (unifikovaný název zdroje) by měl vybavit internetové zdroje trvalým jménem, které je nezávislé na lokaci a ob
ecně jednoznačné.
Získávání elektronických zdrojů pro konzervační fond
Ukládání elektronických publikací na archivní server nelze provádět bez souhlasu vydavatele. Ve většině zemí, kde se projekty týkající se uchování těchto zdrojů řešily již v dřívějších letech, bylo uzákoněno (nebo se zákon připravuje) právo depozitních knihoven na “povinný výtisk”, a dočasně se řeší archivace těchto dokumentů formou dohody s vydavateli. Povinný výtisk podložený zákonem je obvyklým prostředkem, kterým depozitní knihov
ny mohou zajistit, aby kulturní dědictví bylo zachováno pro budoucnost.S archivováním elektronických publikací souvisí stanovení podmínek přístupu k archivovaným elektronickým zdrojům. Zpřístupňování těchto dokumentů musí vyhovovat autorskému právu, tzn. je třeba zajistit ochranu proti neoprávněnému využívání a kopírování archivovaných publikací.
Ověřování autentičnosti elektronických publikací
Pro zjišťování nových verzí elektronických dokumentů publikovaných v síti existují automatické prostředky, které ovšem nejsou schopny posoudit rozsah změn a tudíž stanovit podle určitých kritérií, zda se jedná o skutečnou obsahově novou verzi. Pro konzervační fond je třeba zajistit archivaci původní verze připravené vydavatelem/výrobcem dokumentu. Ověřování au
tentičnosti by mohl poměrně snadno napomoci soubor údajů Dublin Core, který může nabídnout nakladatelům jednoduchý mechanismus pro vyplňování potřebných údajů ve zdroji, včetně indentifikačních údajů pro označení verze publikace.Také pro vyhledávání zm
ěn v internetových adresách (URL) uvedených v dokumentech lze použít automatizovaných nástrojů.
Organizace a řízení virtuálních elektronických publikací
Díky mobilitě a nestabilnosti elektronických informačních zdrojů ve virtuálním prostoru není bibliografická kontrola těchto dokumentů zdaleka tak snadná jako u fyzických nosičů. Potřebnost bibliografické kontroly u síťových elektronických publikací je předmětem intenzivních debat. Oponenti myšlenky knihovnického přístupu, tj. bibliografického zpracov
ání, argumentují, že není v lidských možnostech zachytit veškerou produkci publikací v síti, která stále narůstá a přitom se může neustále měnit. Zvažuje se možnost využití vyhledávacích strojů a velkokapacitních paměťových médií pro průběžné ukládání (archivaci) veškeré produkce. V tomto případě se ovšem z koncepce vytrácí smysl národní registrující bibliografie.Velké katalogizační agentury (např. OCLC) používají propracované bibliografické standardy jako AACR2, ISBD(ER) a formáty MARC. Využití těchto standardů umožňuje kooperativní zpracování s využitím nadstavbových systémů pro věcný popis a vyhledávání a také integraci tištěných i elektronických zdrojů v jediném knihovnickém systému.
Závažný problém organizace přístupu k síťovým elektronickým zdrojům vzniká z nespolehlivosti internetových adres (URL), které se často mění. Pokud dojde k nekontrolované změně URL, důsledky se projeví ve všech dokumentech uvádějících toto URL (odkazy v dokumentech na webu nebo v bibliografických záznamech). Stabil
itu adres nabízí řešení programu IETF (Internet Engineering Task Force) – vývoj identifikátorů URI (Uniform Resource Identifiers), např. URN (Uniform Resource Name) jako trvalý název internetovského zdroje.Také pro popis síťových informačních zdrojů umístěný přímo v dokumentu bylo potřeba vyvinout jednotný standard metadatových prvků. V současné době se zdá, že se svět knihovníků i pracovníků z oblasti IT sjednotil na souboru metadatových prvků Dublin Core (DC Metadata Set). Jde o obdobu CIP, které u ele
ktronických publikací může pomocí standardizace metadat obsažených ve zdroji zvýšit kvalitu popisu síťových elektronických zdrojů, sloužit jako kontrolní mechanismus pro jiné knihovny, zlepšit identifikaci a autentičnost vyhledaných zdrojů, napomáhat sdílené katalogizaci i při vyhledávání.Vyvíjejí se softwarové nástroje umožňující vydavatelům jednoduchý a jednotný zápis potřebných údajů ve zdroji a nástroje pro převod dat z formátu DC do formátu MARC.
Závěr
Na většinu složitých činností souvisejících se získáváním, zpracováním, ochranou a zpřístupňováním lze použít speciálních softwarových a hardwarových prostředků, které lidskou práci dokonale nahradí, nebo alespoň usnadní, a přispějí k vyšší kvalitě. Nicméně, pokud má národní bibliografie přetrva
t i v oblasti dálkově přístupných elektronických zdrojů, bude zde hrát i nadále podstatnou roli intelektuální lidská činnost, kterou pro výběr dokumentů nelze nahradit automatickou činností strojů.
Použité informační zdroje