Velkoplošné licence na EIZ a jejich využití - část II

Předseda: Svatopluk Rieger, Slezská univerzita, Opava a Univerzita Palackého - Informační středisko Přírodovědecké fakulty, Olomouc

23.5.2002

8:30 - 12:20

Nová aula

Funkcionalita CASLIN – Souborného katalogu ČR jako centralizovaného zdroje pro informační profesionály a katalogizátory

Gabriela Krčmařová, Národní knihovna České republiky, Praha
Ilona Trtíková, Národní knihovna České republiky, Praha

Problematika centralizovaného zpracování heterogenních dat v rámci CASLIN – Souborného katalogu ČR a jejich zpřístupnění (protokol http a Z39.50). Současná funkcionalita souborného katalogu (vyhledávání informací o lokalizaci dokumentů v knihovnách ČR, služby MVS, online a offline sdílená katalogizace), aplikace pro využití báze národních autorit. Vyvážení funkcionality z hlediska potřeb informačních rešeršérů a katalogizátorů. Stručný popis jednotlivých modulů systému CUBUS, ve kterém je provozován souborný katalog. Zapojení souborného katalogu do Jednotné informační brány. Souborný katalog je přístupný na URL adrese: http://www.caslin.cz.



CASLIN - Souborný katalog ČR (dále jen souborný katalog) je národní centralizovaný heterogenní souborný katalog, což v praxi znamená, že do jedné databáze shromažďuje záznamy o dokumentech českých a moravských knihoven, které požívají různé knihovnické systémy. Od roku 2000 je provozován v systému CUBUS, který je šitý na míru potřebám správy a provozu právě takového typu souborného katalogu. Základním předpokladem realizace jakékoliv funkce souborného katalogu je jeho naplnění daty.

1. Import dat do souborného katalogu

Na budování souborného katalogu se v současné době podílí aktivně 57 knihoven (pro knihy a speciální druhy dokumentů). Tyto knihovny přispívají do souborného katalogu především offline, tj. zasílají v pravidelných intervalech dávky nově zpracovaných záznamů nebo záznamů vzniklých v rámci retrokonverze.

Soubory určené k importu jsou předávány do souborného katalogu prostřednictvím FTP, pro automatické zpracování (import) je důležité dodržení názvové konvence u názvu souboru.

Názvová konvence

Délka názvu datového souboru je 8+3 tedy 11 znaků. Prvních 6 znaků názvu tvoří sigla instituce, znaky 7 a 8 popisují použitou znakovou sadu a znaky 9, 10 a 11 popisují formát dat (např. aba001kg.vfi).

Znaková sada (znaky 7 a 8):

  1. um....ISO 646 nebo ISO 5426
  2. gi......veškerá diakritika pomocí GIZMO notace
  3. lg......PC Latin 2 + GIZMO
  4. kg.....kód Kamenických + GIZMO
  5. uc.....UNICODE UTF 8
  6. sg.....ISO 8859-2 + GIZMO
  7. an….ANSEL

Formát dat (znaky 9 až 11):

  1. dat......exportní soubor z ALEPH
  2. rum.....řádkový UNIMARC
  3. uis.......UNIMARC ISO 2709
  4. vfo......Výměnný formát ISO 2709
  5. vfi.......Výměnný formát, exportní soubor ze systému CDS/ISIS
  6. dtt……exportní soubor ALEPH 500

Příklad: aba006lg.uis.....sigla=aba006, znaková sada=PC Latin2 + GIZMO

formát dat=UNIMARC ISO 2709

Výsledek importu může uživatel sám odečíst ze statistik, které jsou na adrese :

http://psi.nkp.cz:2200/d/SKK/p190/p10Init

statistikaje přístupná po zadání hesla a má následující podobu :

 

2. Funkce souborného katalogu

CASLIN - Souborný katalog ČR stejně jako jiné souborné katalogy ve světě plní čtyři základní funkce:

Informační funkce:

Souborný katalog je zdrojem pro vyhledání určitého dokumentu nebo pro získání informací o dokumentech k určitému tématu.

Lokalizace dokumentu:

Souborný katalog umožňuje nalezení knihovny, v jejímž fondu se hledaný dokument nalézá, případně zjištění podrobných informací o signatuře, většinou s cílem získat příslušný dokument.

Získání dokumentu:

Souborný katalog umožňuje realizovat požadavek na vypůjčení dokumentu nebo získání jeho kopie (MVS). Tato služba nemusí být nutně součástí souborného katalogu, služby tohoto druhu jsou však často nabízeny spolu s logistikou rozhodování, které knihovně by se měl požadavek adresovat s ohledem na možnosti té které knihovny.

Sdílená katalogizace:

Souborný katalog je nástrojem pro sdílenou katalogizaci, nabízí přístup k záznamům s možností jejich kopírování, a je nástrojem pro tvorbu a optimalizaci jmenných a věcných autorit.

 

3. Identifikace, lokalizace a získání dokumentu

Databáze souborného katalogu obsahovala začátkem dubna 2002 více než 1.535.440 záznamů. V současné době jsou do souborného katalogu dodávány záznamy tištěných monografií, speciálních druhů dokumentů a seriálů. Všechny záznamy procházejí formálně logickými kontrolami a testem na UNIMARC, jsou jim přiděleny kvalitativní váhy a kromě záznamů seriálů jsou po kontrole duplicit zpřístupněny. Záznamy seriálů jsou zatím v bázi uloženy se statusem wait a pro vyhledávání, online aktualizaci nebo případnou editaci budou zpřístupněny v červenci 2002 po dořešení automatického spojování jednoznačných duplicit přímo v bázi s možností postoupení nejednoznačných duplicit k ruční kontrole správci. Po té budou do souborného katalogu konvertována také data souborného katalogu zahraničních periodik (začátkem dubna 2002 obsahoval 70.318 titulů, na jejich aktualizaci se podílí 550 knihoven celé ČR) a databáze českých periodik, která obsahuje 11.900 titulů (aktualizace je však zatím realizována pouze u titulů, které se nacházejí ve fondu Národní knihovny ČR).

 

Ukázka záznamů periodik v souborném katalogu:

 

 

 

Sigla vlastníka (např.ABA001) propojí záznam s údaji o knihovně, která příslušný dokument vlastní, je provedena lokalizace dokumentu v rámci ČR:

Rozšířené menu souborného katalogu se nabízí pouze aktivním účastníkům souborného katalogu po zalogování (hesla přiděluje správce po podpisu Smlouvy o spolupráci na CASLIN - Souborném katalogu ČR):

 

 

Účastníkům jsou k dispozici tyto služby:

  • schránka, která je určená pro pozdější využití vyhledaných záznamů (tisk, popř.export dat)
  • editace vlastních záznamů
  • zaslání žádanky MVS, kde se údaje o knihovně generují z adresáře a údaje o dokumentu ze záznamu v souborném katalogu.

 

Příklad vyplněného formuláře pro MVS v souborném katalogu:

 

 

4. Sdílená katalogizace

Aktivní účastníci, tj. ty knihovny, které do souborného katalogu dodávají záznamy, mají možnost po přidělení hesla využít sdílenou katalogizaci v rámci souborného katalogu:

  • dávkový export dat v podporovaných formátech a znakových sadách na ftp server, do souboru, e-mailem
  • online sdílená katalogizace s využitím připraveného formuláře.

Stejně jako většina poskytovatelů služeb na internetu, zvolil také správce souborného katalogu jako primární přístup do katalogu protokol http. Plánovaná implementace komunikačního protokolu Z39.50 (2002/2003) nepřinese soubornému katalogu žádnou novou funkcionalitu, poskytne však knihovnám, jejichž systémy mají Z39.50 implementován, možnost kvalitnějšího sdílení dat.

 

Příklad formuláře pro editaci záznamu (obdobný formulář je využíván při online katalogizaci v souborném katalogu):

 

Příklad exportovaného záznamu (řádkový UNIMARC):

 

5. Souborný katalog v Jednotné informační bráně

Souborný katalog jako jeden z významných informačních zdrojů byl napojen na Jednotnou informační bránu (dále jen JIB) pomocí externího programu, který zajišťuje konverzi dotazu a poté jeho výsledku mezi oběma systémy.

Dotaz, který zadá uživatel JIB, je poslán do souborného katalogu přes http protokol (viz níže Parameters for query) v kódování UTF-8 a ve tvaru:

http://adresa serveru?přístupový soubor=hodnota&přístupový soubor=hodnota

Příklad:

Hledám díla, která publikoval Erik Saudek v edici Divadelní hry v letech 1983 a 1985:

http://psi.nkp.cz:2200/d/SKK/p242/p10?ptAU=Saudek,ErikA.&psAU=s&ptSR=Divadeln%C3%ADhry&ptYY=1983,1985

Výstupem je záznam exportovaný ve formátu jazyka XML. Rozsah záznamu je kompromisem mezi zobrazovanými údaji v MetaLibu a specifiky souborného katalogu, tj. záznam obsahuje základní identifikační údaje o dokumentu plus název knihovny, která dokument vlastní, a u periodik také roky odběru.

Pro výstup v XML správce souborného katalogu vytvořil pouze takové DTD (viz níže DOCTYPE CaslinMeta), které splňuje momentální potřebu souborného katalogu k napojení na JIB. Počítá se s tím, že v budoucnu nebude problém kdykoliv navrhované DTD rozšířit či pozměnit podle celosvětově uznané definice typu dokumentu pro formáty v knihovnictví.

 

Parameters for query

Name

Value

Explanation

Comment

ptAU

Author or single words from author

according to the parameter psAU

 

psAU

w

in the parameter ptAU are words from autor

Link between words is AND

 

s

in the parameter ptAU is name of autor

 

ptTI

Title or single words from title

according to the parameter ptAU

 

psTI

w

in the parameter ptTI are words from title

Link between words is AND

 

s

in the parameter ptTI is title

 

ptBNSNMN

ISBN / ISSN / ISMN

It is for input one of the possible data field , the character "-" dash is eliminated.

 

ptBNSN

ISBN / ISSN

It is for input one of the possible data field , the character "-" dash is eliminated.

 

ptSN

ISSN

It is for input one of the possible data field , the character "-" dash is eliminated.

 

ptDC

UDC

 

 

ptKW

Keywords

 

Link between words is AND

ptCP

Corporate Name or single words from Corporate Name

according to the parameter psCP

 

psCP

w

in the parameter ptCP are single words from Corporate Name

Link between words is AND

 

s

in the parameter ptCP is Corporate Name

 

ptSR

Series

 

 

psSR

Series or words from series

It is not realized in this version of the system.

 

ptYY

Year of publication

It is possible to enter more data split by , (comma)

Data in form : from-to or from- or -to. Link between data is OR

 

Parameters for query - extension for Metalib

Name

Default Value

Explanation

pcCNT

50

maximum number of records in output

pcIGN

0

Number of eliminated records in output

Comments:

Link between parameters pt* is AND.

Default value for parameter ps* is = w.

The wildcard character is possible to be used anywhere

* for more characters

? only for one character

No input field is mandatory.

If no searching field is filled, the number of found records is =0.

In case of input field is split to the words, than the seperator is space

( ptAU, ptTI, ptCP, ptKW )


It is necessary to use character set utf-8.

Examples:

1.I find documents about exhibitions(in Czech=výstava),which arranged the National Library of the CR(in Czech=Národní knihovna ČR) in years 1996 to 1998 and the author of the documents is Vojtěch Balík.

http://psi.nkp.cz:2200/d/SKK/p242/p10?ptAU=Vojtech Bal%C3%ADk&psAU=w&ptKW=v%C3%BDstav?&ptCP=N%C3%A1rodn%C3%AD knihovna&psCP=w&ptYY=1996-98

2. I find a book translated by - Erik A. Saudek and it was issued in series= Divadelní hry in the year 1983 or 1985

http://psi.nkp.cz:2200/d/SKK/p242/p10?ptAU=Saudek,Erik A.&psAU=s&ptSR=Divadeln%C3%AD hry&ptYY=1983,1985

3.I find the book Romeo and Juliet and the book was issued in edition Penguin Popular Classics

http://psi.nkp.cz:2200/d/SKK/p242/p10?ptTI=Romeo Jul*t&psTI=w&ptSR=Penguin Popular Classics

4. I find a book with ISBN 1-56496-335-7 and title WWW design and UDC is 621.39

http://psi.nkp.cz:2200/d/SKK/p242/p10?ptBNSNMN=1564963357&ptTI=WWW design&psTI=s&ptDC=621.39

<?xml version="1.0" encoding="UTF-8"?>

<!-

DOCTYPE CaslinMeta

Version: 1.1

Creatin date: 12.07.2001

Last modification date: 21.11.2001

This XML DTD describes output for MetaLib from CASLIN Union Catalogue

Description ELEMENT ATTRIBUT:

recordSet document

recordCnt number of records, which are result of searching

attrecordCnt return code

= OK

= ERROR error on serching

(incomplete query, limit exceeded)

recordList records, which are result of searching

RecordContent record (data belong to one record)

attRecordContent kind of record

= book

= serial

= special

NAME Explanation

ISBN An International Standard Book Number.(Unimarc field 010a)

ISSN An International Standard Serial Number.(Unimarc field 011a)

ISMN An International Standard Music Number. (Unimarc field 013a)

TITLE It contains name of the document, by the standard ISBD include subtitle, number of section and name of section.(Unimarc field 200aehi)

AUTHOR It contains name of author - primary intellectual responsibility.(Unimarc field 700abf )

ADDAUTHOR attField = 701 Name of additional author - alternative intellectual responsibility (Unimarc field 701abf)

attField = 702 Name of additional author - secondary intellectual responsibility (Unimarc field 702abf )

EDITION It contains main name of edition. (Unimarc field 205a)

YEAR It contains the year of publication.(Unimarc field 210d)

DESCR It contains information of the physical description of the document.(Unimarc field 215a)

IMPRINT It contains publication place, name of publisher. (Unimarc field 210acd)

UDC An Universal Decimal Classification number. (Unimarc field 675a)

SUBJECT attField = 606 It contains subject headings.(Unimarc field 606a)

attField = 610 It contains keywords. (Unimarc field 610a)

NameSign An alphanumeric code of the library, which own document. (Unimarc field 910a )

NameLib It contains name of the library, which own document.

SHELFMARK A code of the document in the library (Unimarc field 910b)

SUBSCR It contains the years of subscription of the serial in the library. (Unimarc field 910r)

VOLUME It contains number of volume of the document. (Unimarc field 910s)

Attributs:

attsrcRepeat occurence data

= fst first occurence data

= next occurence data

attrecordCnt return code

= OK

= ERROR error during searching( incomplete query, limit exceeded)

attRecordContent kind of document

= book

= serial

= special

------------------------------------------------------------------ -->

<!ENTITY % attSrcRepeat "srcRepeat ( fst | next ) 'fst'" >

<!ENTITY % dataContent "#PCDATA">

<!ELEMENT recordSet ( recordCnt, recordList?)>

<!ELEMENT recordCnt (#PCDATA)>

<!ELEMENT recordList (RecordContent*)>

<!ELEMENT RecordContent (ISBN*, ISSN*, ISMN*, TITLE?, AUTHOR?, ADDAUTHOR*, EDITION*, YEAR*, DESCR*, IMPRINT*, UDC*, SUBJECT*, NAME*)>

<!ELEMENT NAME (NameSign, NameLib?, SHELFMARK*, SUBSCR*, VOLUME*)>

<!ELEMENT ISBN (%dataContent;)>

<!ELEMENT ISSN (%dataContent;)>

<!ELEMENT ISMN (%dataContent;)>

<!ELEMENT TITLE (%dataContent;)>

<!ELEMENT AUTHOR (%dataContent;)>

<!ELEMENT ADDAUTHOR (%dataContent;)>

<!ELEMENT EDITION (%dataContent;)>

<!ELEMENT YEAR (%dataContent;)>

<!ELEMENT DESCR (%dataContent;)>

<!ELEMENT IMPRINT (%dataContent;)>

<!ELEMENT UDC (%dataContent;)>

<!ELEMENT SUBJECT (%dataContent;)>

<!ELEMENT NameSign (%dataContent;)>

<!ELEMENT NameLib (%dataContent;)>

<!ELEMENT SHELFMARK (%dataContent;)>

<!ELEMENT SUBSCR (%dataContent;)>

<!ELEMENT VOLUME (%dataContent;)>

<!ATTLIST recordCnt attrecordCnt (OK | ERROR ) #REQUIRED>

<!ATTLIST RecordContent attRecordContent (book | serial | special) #REQUIRED>

<!ATTLIST ISBN attISBN %attSrcRepeat;>

<!ATTLIST ISSN attISSN %attSrcRepeat;>

<!ATTLIST ISMN attISMN %attSrcRepeat;>

<!ATTLIST ADDAUTHOR attADDAUTHOR %attSrcRepeat; attField ( 701 | 702 ) #REQUIRED>

<!ATTLIST EDITION attEDITION %attSrcRepeat;>

<!ATTLIST YEAR attYEAR %attSrcRepeat;>

<!ATTLIST DESCR attDESCR %attSrcRepeat;>

<!ATTLIST IMPRINT attIMPRINT %attSrcRepeat;>

<!ATTLIST UDC attUDC %attSrcRepeat;>

<!ATTLIST SUBJECT attSUBJECT %attSrcRepeat; attField ( 606 | 610 ) #REQUIRED>

<!ATTLIST SHELFMARK attSHELFMARK %attSrcRepeat;>

<!ATTLIST SUBSCR attSUBSCR %attSrcRepeat;>

<!ATTLIST VOLUME attVOLUME %attSrcRepeat;>

<!-- ==== END OF DTD ============================================ -->

 

6. Reálné a virtuální souborné katalogy

Zavedením výpočetní techniky, knihovnických systémů a formátů MARC, došlo k radikálnímu zlepšení z hlediska přístupu k informacím v souborných katalozích ve srovnání s klasickými lístkovými soubornými katalogy. Zatímco úkoly a problémy spojené se správou souborného katalogu (import dat, řešení duplicit záznamů, překonání heterogenity systémů, apod.) se kupodivu nezměnily, v celkových nákladech na správu a provoz elektronických souborných katalogů došlo pravděpodobně ke změně k horšímu. Vysoké náklady na provoz reálných souborných katalogů jsou nejspíše hlavním důvodem, proč se začátkem 90.let 20.století těsně po té, co se ve světě Internetu usadil World Wild Web, začaly objevovat první informační brány (gateway). V České republice byly v polovině 90.let 20.století zprovozněny dva virtuální souborné katalogy v celostátním měřítku:

  • homogenní TinWEB jako systém pro paralelní prohledávání knihovních katalogů v systému Tinlib
  • heterogenní ATpar (Aleph-Tinlib paralelní dotazovací systém) byl navržen a implementován za účelem transparentního prohledávání několika zvolených knihovních katalogů ve WWW rozhraní systému Aleph a Tinlib pomocí jednoho dotazu.

V knihovnické komunitě jsou samozřejmě přístupy do Z39.50 zdrojů realizovány také prostřednictvím informačních bran založených na WWW, kde rozhraní pro koncového uživatele je browser (v roce 2001 v ČR např. JIB).

Obecně lze říci, že informační bránu lze považovat za virtuální souborný katalog tehdy, pokud z pohledu koncového uživatele splňuje následující požadavky:

  • přístup je realizován přes jedno uživatelské rozhraní
  • formulace rešeršních dotazů jsou vyjádřeny jednotnou syntaxí, používající jednu společnou sadu vyhledávacích atributů (sadu atributů)
  • záznamy jsou získány v jednom společném formátu, umožňující jednotné zobrazení záznamu
  • duplicitní záznamy se nezobrazují
  • úplné lokační údaje a úplné informace o knihovním fondu jsou k dispozici u všech záznamů
  • aktualizovaný status výpůjček a dostupnosti je uveden u všech exemplářů
  • virtuální souborný katalog je propojen s několika sjednocenými výpůjčními a objednávkovými službami.

Informační brány jakožto virtuální souborné katalogy ocení především běžní uživatelé při potřebě získat rychle informaci o dokumentu. Profesionální knihovníci při realizaci meziknihovních služeb a při sdílené katalogizaci upřednostňují reálné souborné katalogy, kde mají k dispozici v jedné databázi předtříděné a zhodnocené záznamy desítek či stovek knihoven.

 

7. Závěr

V průběhu 90.let minulého století podporovala americká Mellonova nadace nemalými finančními prostředky rozvoj knihovnictví ve střední a východní Evropě; byly zde podporovány projekty týkající se automatizace knihoven a jejich napojení na Internet, mikrografie, retrokonverze klasických katalogů, budování souborných katalogů, pod. Zástupce Mellonovy nadace profesor Andrew Lass prohlásil, že z podporovaných států se Česká republika dostala v některých oblastech nejdál a jednou z těchto oblastí je právě budování a rozvoj národního souborného katalogu.


O autorovi:

Gabriela Krčmařová vystudovala obor knihovnictví a vědecké informace na FF UK, graduovala v roce 1981. Od roku 1981 pracuje v Národní knihovně ČR v oddělení správy souborných katalogů (CEZL, CASLIN). Na problematiku souborných katalogů je zaměřena také odborná publikační činnost, přednáří na knihovnických akcích doma i v zahraničí, ap.

  

AiP logo © 2002 Albertina icome Praha s.r.o.
INFORUM® a IN® jsou registrované ochranné známky. 
Všechna práva vyhrazena.
Aktualizováno 20.05.2002

Grafický design Logo STUDIO aha!

Zpracování dat Digital Art Studio