Standardowe narzędzia do wyszukiwania informacji w Sieci Bogdan Miś, 2006.

1 Standardowe narzędzia do wyszukiwania informacji w Siec...
Author: Maja Sadowska
0 downloads 0 Views

1 Standardowe narzędzia do wyszukiwania informacji w Sieci Bogdan Miś, 2006

2 Autor: Bogdan Miś2 Typy narzędzi wyszukiwawczych  Katalogi  DMOZ, Yahoo!, Librarians' Index, Infomine, About.com, AcademicInfo, Onet, Wirtualna Polska, Google DMOZYahooLibrarians' IndexInfomineAbout.com AcademicInfo  Wyszukiwarki  Google, AltaVista Advanced Search, Northern Light, Alltheweb, Szukacz, NetSprint, SnapAltaVista Advanced SearchNorthern Light AllthewebSnap  Metawyszukiwarki  Friskr, Clusty, Ask.com, Metacrawler, Ixquick, Copernic (program), Watson (program) FriskrClustyAsk.comMetacrawlerIxquick

3 Autor: Bogdan Miś3 Katalogi  Wyselekcjonowane przez człowieka zestawy witryn, zalecane przez ekspertów  Często – ale nie zawsze! - bardzo starannie badane i aktualizowane. Aktualizacja tym rzadsza i mniej prawdopodobna, im większe i bardziej ogólne zasoby.

4 Autor: Bogdan Miś4 Katalogi  Zwykle zorganizowane w hierarchiczne struktury kategorii.  Często (ale nie zawsze) udostępniające krótki opis odnośnika.  Można przeszukiwać wybrane kategorie, lub całe zasoby.  Nie dają dostępu do całego tekstu dokumentu. Z tego względu wyszukiwanie musi być mniej specjalistyczne niż przy użyciu wyszukiwarki. Za pomocą katalogu przeszukuje się jedynie tytuły witryn i (ewentualnie) ich opisy; nie same witryny!

5 Autor: Bogdan Miś5 Wyszukiwarki  Przeszukują cały tekst dokumentu lub wybranej witryny  Szukają wedle słów kluczowych, starając się je dokładnie znaleźć w jakiejś witrynie  Nie korzystają z podziału witryn na żadne kategorie

6 Autor: Bogdan Miś6 Wyszukiwarki  Baza danych powstaje dzięki użyciu „pajączków” (specjalnych programów, penetrujących i indeksujących Internet przy minimalnym udziale człowieka)  Zasięg od bardzo małego i specjalistycznego, do 90% i więcej dostępnych zasobów Sieci

7 Autor: Bogdan Miś7 Metawyszukiwarki  Metawyszukiwarki dają jednoczesny dostęp do wielu (niekiedy: kilkudziesięciu) wyszukiwarek.  Zwracają wynik wyszukiwania na ogół w wygodnej formie tabelarycznej.  Czasami bardzo pomysłowo grupują wyniki  Niestety, najczęściej dostęp do każdej wyszukiwarki dotyczy tylko ok. 10% jej zasobów.

8 Autor: Bogdan Miś8 Jak działa robot, czyli „pajączek”?  Przeszukuje witrynę w trybie tekstowym  Uwzględnia:  Tytuł  Opis  Zadeklarowane przez autora witryny słowa kluczowe  Pozostałe słowa (bez spójników, rodzajników itp.)  Nie uwzględnia nietekstowych znaków sterujących i słów oznaczających polecenia w kodzie witryny  Aktualizuje w witrynie macierzystej odpowiednią bazę danych

9 Autor: Bogdan Miś9 Czego robot nie znajdzie?  Obrazu  Dźwięku  Filmu  Informacji z bazy, używającej nietekstowego sposobu interpretacji danych Robot nie znajdzie – jeśli obiekt szukany nie jest specjalnie opisany tekstowo, ani nazwa pliku, w którym jest zarejestrowany, nie kojarzy się bezpośrednio z zawartością:

10 Autor: Bogdan Miś10 Od czego zacząć szukanie? (1)  Wykonaj analizę tematu, odpowiadając na siedem następujących pytań: 1.Czy są związane z tematem wyszukiwania – i jakie – unikatowe słowa, wyróżniające nazwy, skróty lub akronimy? 1.Czy są związane z tematem wyszukiwania – i jakie – unikatowe słowa, wyróżniające nazwy, skróty lub akronimy? - Jeśli tak, to użycie tych właśnie słów jako słów kluczowych (oddzielnie lub łącznie) może szybko doprowadzić do celu. 2.Czy możesz skojarzyć z tematem wyszukiwania jakieś stowarzyszenie, organizację lub grupę społeczną? 2.Czy możesz skojarzyć z tematem wyszukiwania jakieś stowarzyszenie, organizację lub grupę społeczną? - Jeśli tak, to witryna takiej grupy może zawierać poszukiwane treści lub prowadzące do nich odnośniki hipertekstowe. Szukaj informacji, używając pełnych zdań i ujmując je w cudzysłowy.

11 Autor: Bogdan Miś11 Od czego zacząć szukanie? (2) 3.Czy są jakieś inne słowa, które powinny wystąpić w każdej witrynie, poświęconej interesującej cię sprawie? 3.Czy są jakieś inne słowa, które powinny wystąpić w każdej witrynie, poświęconej interesującej cię sprawie? - Jeśli tak, to użyj w wyszukiwaniu tych właśnie słów, poprzedzając je spójnikiem AND albo znakiem +. 4.Czy którekolwiek ze słów, na jakie wpadłeś w punktach 1, 2 i 3 występują zazwyczaj w trwałych związkach frazeologicznych? 4.Czy którekolwiek ze słów, na jakie wpadłeś w punktach 1, 2 i 3 występują zazwyczaj w trwałych związkach frazeologicznych? - Jeśli tak, szukaj odpowiedniej frazy, używając cudzysłowów.

12 Autor: Bogdan Miś12 Od czego zacząć szukanie? (3) 5.Czy którykolwiek ze zwrotów, jakich użyłeś punkcie 5, ma synonim, jakiś specyficzny wariant albo równoważny mu zwrot? 5.Czy którykolwiek ze zwrotów, jakich użyłeś punkcie 5, ma synonim, jakiś specyficzny wariant albo równoważny mu zwrot? Użyj tego zwrotu, ewentualnie łącząc go z podstawowym spójnikiem OR lub łącząc zespoły takich zwrotów nawiasami ()! 6.Czy istnieją słowa lub zwroty, które nie powinny wystąpić w poszukiwanym dokumencie? 6.Czy istnieją słowa lub zwroty, które nie powinny wystąpić w poszukiwanym dokumencie? Jeśli tak, możesz je wyłączyć z wyszukiwania, poprzedzając te zwroty znakiem – albo spójnikami AND NOT. 7.Czy są i jakie terminy lub zwroty OGÓLNIEJSZE od twojego tematu? 7.Czy są i jakie terminy lub zwroty OGÓLNIEJSZE od twojego tematu? Przeszukując bazy danych lub katalogi, przejrzyj właśnie takie tematy uogólniające.

13 Autor: Bogdan Miś13 Nie zalecamy…  Przeglądania katalogów z zawężaniem kategorii.  Przeglądania katalogów z zawężaniem kategorii. Takie postępowanie częściej daje wyniki zabawne niż właściwe. Podział dokumentów na kategorie jest najczęściej subiektywny. Sposób kategoryzacji dokumentów może więc być różny w każdym katalogu – i już samo to może cię wywieźć na manowce. Jeśli tylko to możliwe, przeszukuj cały katalog z użyciem słów kluczowych.  Śledzenia odnośników do witryn „rekomendowanych” lub komercyjnych.  Śledzenia odnośników do witryn „rekomendowanych” lub komercyjnych. Na witrynie często znajdują się odnośniki do stron powiązanych tematycznie, czasem wybrane przez autora witryny, czasem zaś mające wręcz charakter reklamowy (na przykład tzw. linki sponsorowane w Google). Korzystaj z takich odesłań z najwyższą ostrożnością.

14 Autor: Bogdan Miś14 Potrzeba krytycyzmu  Każdy może tworzyć witryny o wszystkim  Liczne witryny są nieaktualne  W Internecie nie ma kontroli jakości  Większość witryn nie jest weryfikowana  Witryny są mniej wiarygodne niż publikacje akademickie

15 Autor: Bogdan Miś15 Co trzeba wiedzieć o witrynie?  Czy wiadomo kto ją stworzył?  Nazwisko autoraname of page author  Rozpoznawalna nazwa organizacji lub instytucji  Podanie tylko adresu e-mail nie wystarcza!  Czy witryna ma jakieś referencje?  Szukaj odnośników pod hasłami:  “About us” “Philosophy” “Background” “Biography”  Czy witryna jest aktualna ?  Szukaj daty ostatniej aktualizacji (zazwyczaj na dole strony)  Nie ufaj dacie pokazywanej w opcjach View | Page Info (Netscape) lub File | Properties (IE)

16 Autor: Bogdan Miś16 Co mówi o jakości witryny?  Udokumentowane źródła  Odnośniki, przypisy itp.  Czy są tak samo szczegółowe, jak w profesjonalnych publikacjach drukowanych?  Czy wszystkie odnośniki działają?  Czy informacja nie jest skopiowana lub przepisana?  Czemu nie odesłano bezpośrednio do źródła?  Odnośniki do witryn pokrewnych  Jeśli są – autor nie boi się porównań!

17 Autor: Bogdan Miś17 Co mówią inni?  Zbadaj adres witryny w alexa.com  Kto się na nią powołuje? Kto jest właścicielem domeny?  Wpisz adres witryny do okienka wyszukiwań. Zobacz co wyjdzie!  Czy witryna jest zaliczona do „top 100,000”?  Skorzystaj w Google z szukania Similar pages  Odszukaj dane o autorze korzystając z Google (wpisz nazwisko)