Vyhledávání dokumentů prostřednictvím WWW

Co skutečně hledáme?

Síť www dnes obsahuje kolem miliónu dokumentů. Vyhledávání jednoho konkrétního z nich může být velmi jednoduché, ale může se stejně dobře stát noční můrou. Důvodů je několik:

·         celková velikost všech dokumentů, nabízených prostřednictvím WWW

·         rapidní růst objemu dokumentů nabízených na WWW

·         WWW není indexováno tak jako tradiční informační zdroje (knihovny, indexy časopisových článků

 

Vyhledávání se pochopitelně dnes již nedá realizovat přímým prohledáváním sítě podle hypertextových odkazů. Naštěstí existuje dnes již celá řada služeb, dostupných prostřednictvím sítě www, které nějakým způsobem usnadňují vyhledávání požadovaného dokumentu. Základním problémem je ale naučit se obsluhovat tyto služby. Naštěstí bývá dnes již jejich rozhraní natolik intuitivní, že přímo uživatele navádí k cíli. Někdy však pro svůj záměr potřebujeme jednoduše více, než napsat pojem do příslušného okénka...

 

Rozdělení momentálně dostupných vyhledávacích služeb

Vyhledávací stroje (Search Engines

Charakteristika

Příklady

·         Indexují veškerý text www stránky

·         Vyhledávání podle klíčového slova, snaha o doslovnou indexaci

·         Nerozdělují do kategorií

·         Databáze vytvářeny pomocí softwarových robotů s minimální účastí člověka

·         Velikost – od malých a specializovaných až po stroje s více než 90% pokrytím webu

·         Tvoří de facto kopii současného webu.

Doporučené:

Altavista

Northern Light

Infoseek

Fast Search

Ostatní:

Hotbot

Lycos

Excite

České:

Kompas

Atlas

Meta-vyhledávače (Meta-Search Engines)

·         Dotazují jiné vyhledávací stroje

·         Jsou rychlé, ale vyhledávají povrchně

·         POZOR! Zobrazují jen asi 10% výstupu dotazovaných vyhledávačů.

Metacrawler

Inference Find

Dogpile

Metafind

České:

Seznam

Atlas

Katalogové služby

·         Člověkem tříděné a indexované

·         Hierarchicky uspořádané

·         Často opatřeny popisem případně hodnocením vyhledaného dokumentu

·         Navigace pomocí kategorii, případně vyhledávání pomocí širokýh, mnohoznačných pojmů

·         Nekopírují web, pouze hodnotí a katalogují

Doporučené:

Librarian’s Index

Infomine

Britannica’s Internet Guide

Yahoo!

Galaxy

Ostatní:

Scout Report Signpost

LookSmart

Excite…

České:

Seznam

Zmije

„Subject Guides“
(průvodce tématy, pojmy...)

·         Kolekce hypertextových odkazů na stránky, obsahující určité téma (pojem)...

·         Vytvářeny specialisty, agenturami stejně jako laiky.

·         Navigace pomocí „gudes to guides“, katalogů nebo vyhledávání

Argus Clearinghouse - WWW Virtual Library

České:

Najdi.to

Specializované databáze

·         Web slouží pouze jako rozhraní k vyhledávání v určité počítačové databázi

·         Mohou být mono i polytematické

·         Zpravidla vědecké databáze

Databáze farmaceutických přípravků

Medline

Knihovní indexy

Search.com

 

Závěrem je třeba říci, že obsluha vyhledávacích služeb se velmi liší. Je třeba číst konkrétní doporučení a návody, publikované provozovatelem konkrétní vyhledávací služby.

Tvorba dotazu:


Obecné zásady:

·         Používejte logické operátory ve zvyklých významech: (AND +, OR, NOT -), vyšší celky uzavírejte do závorek
medicína + urologie + (urolithiasis OR „močové kameny“) – operace

·         Pro velmi specifická témata používejte raději fulltextové vyhledávání

·         Pro běžná témata jsou výhodnější  katalogové vyhledávače.

·         Superspecifická témata se vám zpravidla nepodaří najít napoprvé. Zvolte raději širší okruh, navštěvujte stránky a hledejte odkazy na specielní databáze

Váš dotaz obsahuje ...

·         Jednoznačný termín nebo frázi: „reproduktor“, „žárovka“, „Eric Clapton“, „Univerzita Palackého“ – Velmi snadno se vyhledávají, dávají jednoznačné výsledky.

·         Nejednoznačný, ambivalení termín: „tiskárna“, „hudba“ – zpravidla způsobí, že výstup vyhledávače zahltí naprosto nesouvisející stránky

·         Termíny a Fráze u nichž lze předpokládat velmi vysoký počet dokumentů: „computer literature“, „heavy metal“, „Microsoft Windows“, „alternativní umění“ – Zpravidla vyústí v nepřeberné množství dokumentů, které není možno prohlédnout.