|
Transformování
informací ve znalosti
EXCALIBUR
RETRIEVAL WAREä |
|
P.
Kocourek
Útvar
KM aplikací, INCAD |
|
Znalosti jsou dnes zpravidla definovány
jako přesné informace, které naplňují
potřebu, řeší problém, hrají kritickou roli v životě
organizace
a ovlivňují vše od rozhodování až po efektivnost
pracovníků.
Pravděpodobně však nejjasnější definice
znalostí pochází z dob daleko před informačním věkem, elektronickým věkem
a nebo vůbec průmyslovým věkem. Sir Francis Bacon (1561-1626) napsal větu
Knowledge
is power.
Samotné znalosti se ale obvykle ztrácí ve
spoustě papírové dokumentace, elektronických archivech, knihovnách,
podnikových sítích či Intranetech a v neustále narůstajícím
objemu externích informací, jakými jsou příchozí faxy, e-maily, novinkové
služby a především informace na webu.
Důsledek nazývaný Information glut
(zahlcení
informacemi) známe z vyhledávání na Internetu. Pokud používáte Internetové
vyhledávací systémy (např. Yahoo, Altavista), víte, že orientace ve výsledku
je téměř nemožná. Běžný uživatel je ochoten projít maximálně prvních 15-20
dokumentů.
Právě znalostní vyhledávací systémy, mezi které patří produkt Excalibur
Retrieval Ware řeší tento problém důsledným hodnocením relevance dokumentů.
Začít s implementací knowledge management systému znamená začít právě s
vyhledávacím systémem. Při implementaci takového vyhledávacího řešení lze
následující parametry považovat za základní:
-
Záběr systému – rozsah různých
typů dat, ve kterých má být vyhledáváno. Je systém limitován na
text nebo je schopen zvládnout různé typy
digitálních medií?
-
Rychlost vyhledávání – jaká je doba mezi definicí dotazu a dodáním
odpovědi?
-
Výstup dat – jaké jsou možnosti prezentace
výsledku vyhledávání? Poskytuje systém přímý přístup do dokumentů
a je schopen vyhodnocovat relevanci?
-
Možnosti vyhledávání –
Jaké možnosti jsou poskytnuty uživateli pro
definici dotazu? Jsou nezbytné hlubší znalosti dotazovacího jazyka
nebo systém umožňuje zadat dotaz pomocí přirozeného
jazyka?
-
Odezva – poměr všech
relevantních dokumentů k dotazu ve vyhledaném souboru a dokumentů,
které nebyli při vyhledávání nalezeny.
-
Preciznost – poměr vyhledaných
dokumentů,
které jsou relevantní odpovědí na zadaný
dotaz a vyhledanými dokumenty, které relevantní nejsou
Pro srovnání vyhledávacích systémů, lze použít tento výčet základních kriterií.
Poslední
dvě (odezva a preciznost)
jsou klíčovými,
zejména v textovém
vyhledávání. Tyto dvě kritéria
reprezentují celkovou přesnost a efektivnost
vyhledávacích systémů.
Excalibur Retrieval Ware
Intuitivní znalostní vyhledávací systém společnosti Excalibur Technologies
založený na technologiích APRP a Semantické sítě.
Základní vlastnosti aplikace:
-
Vysoká úroveň relevance a rychlosti vyhledávání i z databází o objemu terabytů
dat.
-
Schopnost zvládat soudržnost rychlosti vyhledávání ve velkých souborech
dat při více-serverové a více-vláknové architektuře.
-
Schopnost spojit rozličné zdroje dat, typické pro podniková řešení, jakými
jsou například data relační databáze, elektronické dokumenty a skenované
dokumenty do plnotextové databáze pomocí technologie APRP .
-
Volba jednoduchého, uživatelům známého rozhraní webovského prohlížeče nebo
zakomponovaného rozhranní v populárních prostředích jakými jsou groupware,
workflow a dokument management systémy.
-
Vysoká úroveň spolehlivosti pomocí APRP tolerance chyb, umožňující uživateli
vyhledat požadované informace bez ohledu na překlepy v zadávaném dotazu
nebo v původním dokumentu v prohledávaných datech.
-
Indexace bez zásahu do dat, bez ohledu na jejich zdroj, umožňující jednoduchou
implementaci a velmi nízká rizika projektu.
Technologie produktu Retrieval Ware
APRP (Adaptive Pattern Recognition
Processing) je původní technologie produktů Excalibur. Byla vyvinuta
zakladatelem společnosti James Dowe III v roce 1980. Technologie, založená
na metodě neuronových sítí umožňuje indexování a vyhledávání dat na binární
úrovni.
Právě tyto schopnosti přináší řadu výhod:
-
Řešení je jazykově nezávislé. Veškeré informace, bez ohledu na to v jakém
jazyce, jsou ukládány v počítačích binárně.
-
Řešení je nezávislé na typu dat ze stejného důvodu. Může být proto aplikováno
na vyhledávání v textových datech, video datech a obrazových datech. Pro
vyhledávání (porovnávání) obrazových souborů (produkt Excalibur Visual
Retrieval Ware) a indexování a porovnávání video sekvencí (Excalibur ScreeningRoom).
APRP vzešla z biologického výzkumu a tím přináší dva další důležité atributy.
-
Je extrémně "fuzzy" ve způsobu jakým vyhledává.
-
Je velice efektivní, přináší v porovnání s velice malým indexovým souborem
vyjímečně vysoký výkon.
Technologie APRP znamená schopnost vyhledávat data přibližná zadanému dotazu
a má toleranci chybovosti na vstupu dat i v dotazech.
Také eliminuje nutnost opravování výsledku OCR, což je velmi přínosné
zejména v aplikacích, kde se zpracovávají velké objemy skenovaných dokumentů.
APRP je základní komponentou všech vyhledávacích produktů Excalibur Technologies.
Semantická síť
Technologie produktu založená na lingvistických funkcích je v současnosti
je dostupná pro nejrozšířenější světové jazyky. Pro český jazyk by měla
být dokončena v letošním roce.
Je skutečností, že v dnešní době, kdy lze využívání počítačů považovat
za běžnou záležitost, není možné chtít po uživatelích složitě definované
dotazy, které by vedli k relevantním výsledkům. Proto systémy usilují o
co nejdokonalejší dotazování přirozeným jazykem.
Optimální zpracování dotazu v přirozeném jazyce umožňuje produktu Excalibur
Retrieval Ware kombinace výše zmíněných technologií. Systém je schopen
zpracovávat dotaz i ve vícejazyčném prostředí.
Mezi uživatele produktu Excalibur Retrieval Ware patří instituce jakými
jsou British Library, Library of Congress, Encyclopedia Britannica
a E-blast, World News Connection, Yahoo, SSAI NASA, Electric Library, World
Bank, United Airlines, Ford, HP, Boeing, a další.
V české republice si můžete vyzkoušet aplikaci v prostředí Souborného
katalogu knihoven Akademie věd ČR, kde jsou záznamy vědeckých knihoven
zpřístupněny prostřednictvím standardního rozhraní systému Retrieval Ware.
Více informací o systému EXCALIBUR Retrieval Ware naleznete
na stránkách společnosti Incad www.incad.cz
a stránkách Excalibur Technologies www.excalib.com
Na stránkách najdete také odkazy na dema.